<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>数据抓取/数据分析</title>
	<atom:link href="http://www.htmldata.cn/?feed=rss2" rel="self" type="application/rss+xml" />
	<link>http://www.htmldata.cn</link>
	<description>数据采集&#38;数据分析(seo&#38;sem) QQ:283685878</description>
	<lastBuildDate>Fri, 03 Sep 2010 06:49:15 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.9.2</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>iphone/ipad应用程序开发群</title>
		<link>http://www.htmldata.cn/?p=211</link>
		<comments>http://www.htmldata.cn/?p=211#comments</comments>
		<pubDate>Fri, 03 Sep 2010 06:49:15 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[产品]]></category>
		<category><![CDATA[ipad]]></category>
		<category><![CDATA[ipad开发]]></category>
		<category><![CDATA[iphone]]></category>
		<category><![CDATA[iphone开发]]></category>

		<guid isPermaLink="false">http://www.htmldata.cn/?p=211</guid>
		<description><![CDATA[iphone/ipad应用程序开发群 QQ群:121038385
]]></description>
		<wfw:commentRss>http://www.htmldata.cn/?feed=rss2&amp;p=211</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>2010百度世界大会个人心得</title>
		<link>http://www.htmldata.cn/?p=207</link>
		<comments>http://www.htmldata.cn/?p=207#comments</comments>
		<pubDate>Fri, 03 Sep 2010 02:58:53 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[ppc]]></category>
		<category><![CDATA[sem]]></category>
		<category><![CDATA[seo]]></category>
		<category><![CDATA[产品]]></category>

		<guid isPermaLink="false">http://www.htmldata.cn/?p=207</guid>
		<description><![CDATA[大会用了一天的时间，个人感觉收获比较大，百度在此提出了框计算的成果，同时提出框开放理念。邀请了一些行业专家 雷军，蔡文胜，熊晓鸽等等。
百度框计算的提出对于一些中小站长而言既是机会也是一个挑战，如果百度在框里面把很多问题都解决了，那么就把用户劫持在了百度的框里面，而一些中小网站的影响是必然的，百度提出开放的理念说明的是框对站长，对每个人都是开放的，这个时候的框就是一个免费的舞台，每个人都可以成为这个舞台的主角。蔡文胜和雷军都提出对中小站长的影响，两个人不愧是草根的领袖人物，每一个发言都是站在广大站长的角度去考虑的，赢得的掌声也是最多的（比李彦宏的战胜还要多，呵呵），真可谓是百度让人欢喜让人忧呀，结果会是如何要看百度如何去平衡利益点，让我们拭目以待吧。
下午去听了熊晓鸽的一个小论坛，论坛主要讲的是当今中国互联网行业的状况，大部分人认为当今中国互联网是一个霸主割据，创新少，创业者和投资者都是急功近利的时代，整个大环境是不好的，我个人认为这已经是一个不争的事实了。接下来主要讨论的就是创业者在哪些领域还有更多的空间，大家一致认为移动互联网的发展空间很大，因为移动互联网还没有形成行业规则，但与此同时如果要去做的话，耐性的等待和大量资本的投入也是必然的，主要原因在于移动资费至今没有降低，导致现在是一个高成本的投入，这个也是移动行业垄断。而一些靠内容生存的行业还是有机会的，因为互联网的不断发展最终解决的就是有用信息的快速传播，所以做内容仍旧是一个大的方向，但是个人认为做内容是“十年磨一剑”。
会议中谈到了一个小的插曲，中国互联网很少有创新，大部分靠的都是国外的东西直接拿过来，这个最终归根结底是中国教育的问题，但是如何完全的把别人的东西拿过来用，那也是不行的，所以微创新是一个好的思路，这是周鸿祎提出来的概念，我个人认为是正确的，也是中国一些的大企业成功的经验总结，比如腾讯的群 ，快速传输文件等等。
整个大会让我充分的认识到了整个互联网行业的格局，加之自己的一些经验，这次会议让我充分体会到了中国互联网行业的现状，很难再出现 腾讯 百度 阿里巴巴这样的大企业了，但是并不是说机会是没有的，互联网迎来了一个新的时代，对于赶上这个时代新的互联网人而言，新的要求也是伴随而来的。机会从来都是靠自己去争取的，所以我个人认为中国的互联网还有很大的发展空间，机会也是很多，我们需要从中不断总结变通，最终实现自己的梦想。
]]></description>
		<wfw:commentRss>http://www.htmldata.cn/?feed=rss2&amp;p=207</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>php页面跳转</title>
		<link>http://www.htmldata.cn/?p=205</link>
		<comments>http://www.htmldata.cn/?p=205#comments</comments>
		<pubDate>Sun, 29 Aug 2010 13:06:38 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[php]]></category>
		<category><![CDATA[php 跳转]]></category>

		<guid isPermaLink="false">http://www.htmldata.cn/?p=205</guid>
		<description><![CDATA[header(&#8220;refresh:3;url=http://www.lewen.com&#8221;);
print(&#8216;please waiti for 3 seconds&#8230;&#8230;&#8217;);
]]></description>
		<wfw:commentRss>http://www.htmldata.cn/?feed=rss2&amp;p=205</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>百度seo排名不稳定</title>
		<link>http://www.htmldata.cn/?p=203</link>
		<comments>http://www.htmldata.cn/?p=203#comments</comments>
		<pubDate>Fri, 27 Aug 2010 02:46:58 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[seo]]></category>
		<category><![CDATA[百度测试]]></category>

		<guid isPermaLink="false">http://www.htmldata.cn/?p=203</guid>
		<description><![CDATA[之前一直听说百度的seo不稳定，这个事情我也遇到了，而且是核心词“数据抓取”，这个词掉到了第三页，2天后恢复到了第一页的第一名，一般核心词很少掉，我个人觉得主要原因在于整个网站的质量度被其他质量度高的网站挤下去了，还有一种可能性是百度算法的测试，一般测试都会拿一些小站来做。
]]></description>
		<wfw:commentRss>http://www.htmldata.cn/?feed=rss2&amp;p=203</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>乐问被百度采集频率为10分钟</title>
		<link>http://www.htmldata.cn/?p=199</link>
		<comments>http://www.htmldata.cn/?p=199#comments</comments>
		<pubDate>Wed, 25 Aug 2010 23:44:42 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[seo]]></category>

		<guid isPermaLink="false">http://www.htmldata.cn/?p=199</guid>
		<description><![CDATA[呵呵，自勉一下。
]]></description>
		<wfw:commentRss>http://www.htmldata.cn/?feed=rss2&amp;p=199</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>sem之百度超级匹配模式</title>
		<link>http://www.htmldata.cn/?p=195</link>
		<comments>http://www.htmldata.cn/?p=195#comments</comments>
		<pubDate>Wed, 25 Aug 2010 06:46:07 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[ppc]]></category>
		<category><![CDATA[sem]]></category>
		<category><![CDATA[超级匹配]]></category>

		<guid isPermaLink="false">http://www.htmldata.cn/?p=195</guid>
		<description><![CDATA[这个title有点搞，不过确实如此，百度即将推出一种新的匹配模式，目前就三种 1、精确 2、短语 3、广泛。 新出来的第四种匹配模式，暂且称为超级匹配模式，第四种匹配模式已经酝酿许久了，这次算是百度的一个创新吧，因为百度的竞价搜索一直是学习google的，这次倒是自己搞出来的，自己搞出来的也是完全结合中国网络的情况而定的，我猜想新的匹配模式是根据系统推广的一种匹配模式，因为越来越多的人做竞价优化，也就有更多的人不懂得怎么去优化，这么做对百度对用户其实都是有好处的。当然只要百度不要做得太过分，呵呵。
]]></description>
		<wfw:commentRss>http://www.htmldata.cn/?feed=rss2&amp;p=195</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>sem之百度广泛匹配</title>
		<link>http://www.htmldata.cn/?p=190</link>
		<comments>http://www.htmldata.cn/?p=190#comments</comments>
		<pubDate>Wed, 25 Aug 2010 06:13:16 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[sem]]></category>
		<category><![CDATA[seo]]></category>
		<category><![CDATA[sem 广泛匹配]]></category>

		<guid isPermaLink="false">http://www.htmldata.cn/?p=190</guid>
		<description><![CDATA[前几篇文章中说到过，百度的广泛匹配不单单是字面上的匹配，其实是语意匹配，最近查看账户的搜索词，发现大量无关的搜索，也从更多的账户中证明了，百度最近的广泛匹配放的更加的开了，所以各位semer要对广泛匹配的计划添加更多的否定词，或者修改为短语匹配。
]]></description>
		<wfw:commentRss>http://www.htmldata.cn/?feed=rss2&amp;p=190</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>google adsense自动匹配广告</title>
		<link>http://www.htmldata.cn/?p=187</link>
		<comments>http://www.htmldata.cn/?p=187#comments</comments>
		<pubDate>Mon, 23 Aug 2010 03:47:11 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[sem]]></category>

		<guid isPermaLink="false">http://www.htmldata.cn/?p=187</guid>
		<description><![CDATA[开通了google adsense，发现google的自动匹配功能好强大，可以根据具体的页面匹配出相关度最高的广告。而百度最近也申请了，很难通过，不过以前看过一个页面有百度和google的广告，相对而言google更加的强大。
]]></description>
		<wfw:commentRss>http://www.htmldata.cn/?feed=rss2&amp;p=187</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>数据抓取之提高采集速度(php)</title>
		<link>http://www.htmldata.cn/?p=184</link>
		<comments>http://www.htmldata.cn/?p=184#comments</comments>
		<pubDate>Mon, 23 Aug 2010 01:27:47 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[php]]></category>
		<category><![CDATA[产品]]></category>
		<category><![CDATA[数据抓取 采集速度 引用变量]]></category>

		<guid isPermaLink="false">http://www.htmldata.cn/?p=184</guid>
		<description><![CDATA[采用引用就可以提高速度，例如
$html=file_get_contents($ur);
get_info($html);
function get_info($str)
{
//这里是从html中提取一些有用的数据
}
//以上的get_info函数没有采用引用
//如下可以提高采集的速度
function get_info(&#38;$str)
{
//
}
引用之所以可以提高速度，尤其是字符串很大的时候，因为引用并不是把一个字符串赋值给另外一个变量，而是直接引调用原有的数值，只是调用的原有数值的地址，所以省去了付给变量的时间/空间成本。 尤其在大数据了的时候，以用的效果是非常明显的。
]]></description>
		<wfw:commentRss>http://www.htmldata.cn/?feed=rss2&amp;p=184</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>网编如何修改标题会搜索引擎感到新鲜?转载</title>
		<link>http://www.htmldata.cn/?p=180</link>
		<comments>http://www.htmldata.cn/?p=180#comments</comments>
		<pubDate>Fri, 20 Aug 2010 05:48:55 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[sem]]></category>
		<category><![CDATA[seo]]></category>
		<category><![CDATA[网站运营]]></category>
		<category><![CDATA[seo 标题优化]]></category>

		<guid isPermaLink="false">http://www.htmldata.cn/?p=180</guid>
		<description><![CDATA[这个对于网编来说是一个不错的手册。其实这个也是有利于seo的。
网上的文章大多来源于转载，如何定位文章标题区别于其他，使用户和搜索引擎感到新鲜?
1.在你的标题前加上词“介绍”(introducing).
2.在你的标题前加上“公告”(announcing).
3.选用带有“公告”，“通告”类字眼的词语。
4.在标题前加上“新”(new).
5.在标题前加上“现在”(now).
6.在标题前标明“最后”(at last).
7.在标题里注明日期。
8.以新闻样式撰写标题。
9.在标题里着重强调价格。
10.突出减价。
11.突出特殊的商品设计服务。
12.突出一种便捷的付款方案。
13.突出免费服务。
14.提供有价值信息。
15.讲故事。
16.在标题前加上“怎样才能”(how to)。
17.在标题前加上“怎样”二字(how)。
18.在标题前加“为什么”(why)。
19.在标题前加“还有谁”(who else)。
20.在标题前加“征求”(wanted)。
21.以“这”为标题的开头(this)。
22.以“因为”二字作为标题的开头(because)。
23.以“如果”二字开头(if)。
24.在标题前加“建议”(advice)。
25.使用“证明书”式标题。
26.在标题前加“哪一个”(which)。
27.给读者提供一项测试服务。
28.使用一个词one-word标题。
29.使用双词two-word标题。
30.使用三词three-word标题。
31.告诫读者不要去买。
32.使你的标题开诚布公地直接面向读者。
33.使你的标题针对具体对象或群体。
34.你的标题是否提出了一个问题。
35.通过实例和数字向读者展示利益。
约翰.卡普斯就上述规律做了以下说明：上述的这些标题规律已经在过去反复地发生作用并且势必也会在将来产生不何估量的影响。例如：“在你的标题 前加上‘怎么才能’”这条规律就有可能与广告共存亡。因为除非人类从根本上改变天性，否则人们永远不会厌倦去探求他们不知道的事物以及得到他们想要的东西。
另外一种可能永远不会褪色的标题形式是“公告”型。只要人们是生活在这个地球上，他们就会寻找一些新鲜的、与众不同的、更优秀的东西。就像医生  能够数次使用相同的处方而始终能取得很好的疗效，以及工程师运用相同的原理却设计出不同的桥梁一样，在过去的日子里广告撰稿员在遵循同一的规律，却取得了  无数次不同的成功。
对于以上的规律，现在您可能不以为然。若您生活在广州这个大都市，您就会深有感触了：为什么蒙牛的酸酸乳一再强调“升级”“新”这两个词，为什  么泰克感冒药一再强调“新”，难道他们真是“新”的与众不同了吗!而那些更吸引我们眼球，并且让我们决定采取行动的“免费”信息为什么这么有魔力……
]]></description>
		<wfw:commentRss>http://www.htmldata.cn/?feed=rss2&amp;p=180</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
