SEO采集站的原创内容(三)
关于“文章标题”
文一说,从搜索引擎运行原理而言,原创是针对文档标题,而非内容
文二说,采集内容,一是新鲜,二是相关,通过将“关键词”去至少能够显示精确的发布时间,且可以搜索的内容渠道
这一篇说说标题的处理
---------------------------------------------
根据文一,我们的原则是,不能用采集文档的标题,要改
目前验证比较有效,且简单粗暴的,是:“关键词A_关键词A的相关词”这种形式
“关键词A的相关词”从百度相关搜索中找,随机抽取一个即可
----------------------------------------------
也就是有10万词,这个采集系统,分两个大步骤:
1)采集新鲜且相关的内容
2)采集百度相关搜索词
发布的时候,从几个相关搜索词中,随机抽取一个,插在标题里
有条件的,文章发布后,人工过一下,把广告和来源的部分批量删除/替换。比如:“来源于XXXX网”这种
----------------------------------------------
参考(
A、如果是星球里同学的,联系我删除;
B、把浏览器UA改为Baiduspider/2.0在访问
):
股票配资平台_正规股票配资公司与炒股配资开户_股票开户网上综合官网
---------------------------------------------
合理的点击需要介入,确定进入前3页再点
diy:关键词替换的,有现成的插件。但要插入关键词,删除停止词的,估计没有,我研究下py的能不能做成火车头插件(www.230890.com 试试伪原创插件)