博客采集程序分享
在上一家公司的时候,我当时做产品,但是有一个需求是对几个博客网站数据进行采集,有新浪,onlylady,yoka等等几个,开始说有银子挣,后来就坑爹了,这次放出来贡献一下哈,还有一个彩票的采集程序,不再本机上,下次分享, 这次博客的采集程序地址 博客采集程序-php
关于本博客
本博客最初是写一些关于数据抓取的东西,自己做这方面已经有6到7年的时间了,各种语言和数据库都用过了,现在想想实在是没什么东西可写的了,所以在原来名字的基础上,补充了 “数据分析”,数据分析也是自己的兴趣爱好所在,数据分析包含的方面很广泛,不仅仅是纯碎的数字/文字数据,更包括对信息的预处理,例如,互联网产品的分析,这类也是分析,自己的定位是互联网产品经理,所以在这方面会渐渐的多写一些。
新浪博客抓取程序(php)
很多社区论坛或者博客在初期上线时候会遇到没有内容的尴尬,索性他们就会去把别人的优质的内容整理放到自己的平台上,这个时候就会请技术人员写采集程序程序来完成这件事情,以前我在一家公司做产品,同事说做一个可以换点米,所以就写了好几个,后来没有了消息,想程序放着也放着,不如拿出来分享,下载地址:sina blog 采集程序 ,这是借用专业采集类snoopy写的,因为很多博客会禁止采集,所以用snoopy伪装客户端很方便。 数据采集过来要交给编辑去整理发布,采集这么多的数据如何做好分类就是一件很有意义的事情了,编辑可以用这些内容分类汇总,把没有价值的内容去掉,所以数据仅仅采集过来是不够的,接下来就会涉及到数据的分类汇总,对内容进行过滤识别。最近我也一直在做这方面的开发,会在下篇文章重点介绍这方面的内容。
时间/事件管理
时间不安排就会浪费很多,事情不安排就不能最有效的解决问题。虽然现在有很多的工具,但是最重要的仍旧是时间安排和项目管理的意识,这个才是根本,事事时时都要考虑如何把效率最大化,用最短的时间和成本解决掉问题。
跳出率与退出率
跳出率指:某个时间段内,只浏览了一页即离开网站的访问次数占总访问次数的比例。 对于某页面的跳出率算法:从这个页面进入网站没有再点击其他页即离开的次数/所有进入这个页面的次数 对于整个网站跳出率的算法:只浏览一个页面即离开的访问次数/进入网站的总次数 跳出率高说明网站的延续性不够,用户来到你这个页面不知道或者不感兴趣点击其他相关的页面 什么是退出率? 退出率指:某个时间段内,离开网页的次数占该网页总浏览次数的比例。 从本页退出网站的次数/本页的综合浏览量 退出率高说明用户来到这页面的体验未找到与自己的预期,退出率重点在于说明用户通过什么途径来到网站的转化情况 简单理解如下: 跳出率高,说明很多新用户来了,看了一页就离开。(好像有种被骗的感觉) 退出率低,说明新老用户来了都点击很多页才离开。(说明网站内容深受欢迎)
Web交互设计优化的简易check list
“优化已有产品的体验”,这是用户体验相关岗位职责中常见的描述。我们的产品常常是在快速的迭代过程中不断完善的,就像孩子生下来需要养育才能长大一样,优化已有功能/产品,和设计新功能/产品同样重要,不可偏废。 但是,相比实现新功能,已有功能的优化总是显得没有那么紧迫而且很零散,导致了迭代优化的计划总是被归入“重要不紧急”甚至是“不重要不紧急”的象 限,变成了东一棒子西一榔锤的买卖。我们可以通过可用性测试来发现问题,但是测试往往受到时间、用户邀约、场地和设备等条件的限制,可能无法进行。更多时 候,设计师需要根据一定的原则(例如可用性准则)进行走查,以快速地发现并解决问题。 这篇小文章关心的问题是:如果想对非娱乐导向产品已有的交互设计进行优化,我们 需要从哪些方面考虑 遵从什么样的原则 如何开始检查现有的设计 如何确定优化的优先级 而不涉及: 新功能/产品的交互设计过程 娱乐导向产品的设计优化 产品概念、功能层次的优化 适合每一类型产品的tips 具体的优化方法 一、需要优化什么 (Considerations) “设计原则的主要目的之一就是优化用户的产品体验。对于生产工具和其他非娱乐导向的产品而言,这意味着将工作负荷降至最低。”——《交互设计精髓》 行为和界面层面的设计原则告诉我们,应该为降低用户的工作负荷而设计。但是我们常常不够贴心,不知不觉就对用户设下了种种考验,让他们抓狂: 1.视觉负担 visual work 需要分解布局 需要区分内容层次 需要区分视觉元素 需要努力定位目标信息 需要识别阅读起点 需要经常变换视线 视觉流被干扰、打断 2.认知负担 cognitive work 需要理解不熟悉的概念和模式 需要理解冗长、生涩的文本内容 需要理解混乱的结构和布局 需要理解模棱两可的操作 需要猜测系统状态、行为、结果 3.记忆负担 memory work 需要记住对象的各种属性(名字、位置、大小、颜色) 需要记住对象的关联 需要记住操作的命令、步骤、结果 需要记住以往的操作 4.物理负担 physical work 需要长距离移动鼠标 需要进行(多次)点击 需要执行不同的鼠标手势 需要多种操作组合 需要切换输入模式 需要进出不同的页面/区域 需要长时间等待 二、优化目标 [...]
近期评论