我所采集的都是论坛,而且只专注于IT论坛的采集工作,目前网上大部分的IT论坛都曾经被我光顾过,因此我在这方面上也取得了不小的回报。下面让我们进入主题吧!
大家知道,从搜索做流量是最快最有效的方法,也因此不断地有人做B,不断地有人被封。我们也从搜索入手,但是我们不作B。我们提供大量内容让搜索收录,然后让搜索稳定地给我们带来流量。
从搜索做流量有两种方法,一种是热门关键词,比如免费电影,如果你首页排在前列的话,一天可以从上边来一万多IP,但是太危险,两天后你就会消失了,不是长久之计。一种是子页面通过大量收录的方法带来流量。这个方法比较好,一个关键词的量不大,但是我们如果集合起几百个几千个甚至是几万个小关键词的话,这个量可就不容小觊。从实际上来说这儿的量其实比那些热门的词是更可观的。
我们的采集就是用的这第二个方法。
先来讲讲采集一定会有效果吗?
我告诉你,我的这个方法它一定有效,以前和现在有效,以后也会有效。除非不再有搜索! 只要还存在搜索,它就要更新收录内容,而我们只要能做大量的页面让搜索收录,就一定可以带来流量,不是吗?
而最快速的大量页面方法就是通过采集。
为什么选择论坛
网上的内容大部分集中在论坛这些互动交流的平台上,这上面他的信息量大。
这里还有一个最重要的搜索习惯和网站之间竞争的问题。
先说搜索习惯
网民经常搜索这些内容。我们发现论坛贴子的内容与网民使用百度的动机很相似,搜索与论坛这两个是互补的,搜索找不到的人们去论坛询问,又或者论坛没有的人们找搜索(所以百度现在有个贴吧)。论坛的一些贴子标题与搜索关键词非常类似(有空大家也可以研究一下用户的搜索习惯),也因此很容易被搜索到。论坛的内容如果进入搜索你会发现你的点击率非常之高。
竞争的问题
首先论坛上的贴子大部分都是原创的用户交流,也就是独此一份。不像一些新闻到处转载,假如你的网站和新浪上同时有这些内容,我敢肯定你一定竞争不过新浪,你排不了最前,所以你没流量。而论坛的信息(包括回复)一般就独此一份,属于原创性。用户一搜就是你的。
采集的关键是看采集的对象,你所采集的内容是什么,是否在搜索上的搜索量巨大?是不是相同的内容搜索上不多,竞争小,可以确保排在前列?
百度一般不支持论坛的抓取
大家知道,要让百度收录的最好办法就是把页面生成HTML静态网页,而对于一些动态的页面,如论坛的贴子,因为它的地址包含着很多的参数,一般是不容易被收录的。这就给我们留下了一个巨大的市场空白。这个市场上它搜索量高,而百度里相关内容少,假如我们可以把论坛的内容采集过来转化生成HTML页面,然后让百度收录,就可以轻易地排到前列,不是吗。。。
大家可以查询一下这些站点在ALEXA上的排名,这些站点看起来像是论坛,其实不是,它们都是应用我上面所说的采集之后再来生成。这些站点一般都有1万IP以上,如果你一天只采一个,一段时间之后,假如你被百度收录了,你就会发现你的IP很快地达到数万。
好了,我现在已经基本上把为什么采集论坛和它的特点讲清楚了,相信许多人已经跃跃欲试了,那么如何采集和生成呢,我赶快来讲一讲吧
当然是使用采集软件了,目前网上有不少的专业采集软件,它们各有优势,建议使用一些可以进行多线程和能支持网站登录的采集软件,目前所有的论坛均可以实现采集的。
上一篇 露珠:浅谈国内最新备案的相关情况