9 #include virtua... :篇一上 | 下一篇: [ADO]RecordCoun... : |
本日志标题:偷也是门技术——浅谈XMLHTTP应用:新闻小偷   [2005-7-26] |
本文参考互联网整理而成(在此感谢资料奉献者)。希望本文尽量系统,尽量易懂。 偷,即无劳而获。在网络上,诸如某大型权威站点发布了新闻,而自己的小小站点也想与时俱进,和人家一样同步更新,多N啊。于是,偷就是最好的办法了。偷是不道德的,不鼓励偷,但又不提倡不偷,都是技术惹的祸,扯远了~! 小偷程序是什么? 其实是通过XML中的XMLHTTP对象调用其它网站上的网页,甚至可以将接受的HTML代码进行过滤以获得需要内容(比如提取某某气象站,不可能是将整站提取显示,而只是需要显示天气的那部分)。 其实就是一个寄生虫嘛,适合该网站的小偷程序已经唯一确定了,则只要该站点不改版替换相关主要内容,则永远偷下去。否则,就需要相应的修改小偷程序了。btw,在小胖的PUBCMS中已定义为爬虫,我想意思也差不多了:P 那么如何偷呢?看过XMLHTTP介绍的应该了解些。 先定义了一个函数,解释在函数中:
接着就来看看定义编码函数BytesToBstr()的主要内容
当然,还可以使用专门的函数来处理汉字:
lenB返回字节数而不是字符数,同理ascB返回每个字节的ascii码,大于80h,也就是128的ascii是汉字——半个汉字,把半个半个的汉字ascii码拼合再用chr函数返回字符就可以了。 应用则如下:
即表示对 http://www.cnbruce.com/blog 的内容进行“偷”行为,返回了相关该站的内容。 拷贝下列内容保持为ASP文件进行调试 [Ctrl+A 全部选择进行拷贝 提示:可先修改部分代码,再点击运行] 这样一个页就被“偷”下来了。同时,注意到返回的信息中,有的图片不能显示,样式也不能连接,如要正常,则需要将返回的信息做过滤和调整。 那么该如何提取有用的返回信息,做过滤和调整呢? [Edit on 2005-7-27 1:44:47 By cnbruce] 在百度搜索完整的偷也是门技术——浅谈XMLHTTP应用:新闻小偷内容,或者用Google搜索相关的更多内容 |
By [cnbruce] at 1:21:25 | 评论 [59] | 浏览 [40588] | TrackBack| 返回顶部 |
9 #include virtua... :篇一上 | 下一篇: [ADO]RecordCoun... : |
About Comments |
其实现在很多应用随着RSS的流行已经不需要去偷了。 |
By [宇义] at 2005-7-27 9:28:35 |
没有RSS咋办? |
By [gus] at 2005-7-27 10:10:21 |
布鲁丝大大 我是看你的教程漫漫成长的 再次表示感谢 现在做购物车遇到一些麻烦 说也不好说 看您能否抽时间写购物车教程呀 谢谢先 |
By [度得] at 2005-8-1 14:32:20 |
班主有没有在啊,我看了你的一个文章分页代码看不懂,想向你请教能否说一下啊。 |
By [k123456] at 2005-8-2 7:26:55 |
haha 又一次项目比较紧 自己偷自己的网站 一天半就弄个新网站 出来 爽啊 而且免维护的 |
By [dreamisokbaby] at 2005-8-8 10:46:31 |
为什么程序上传到服务器后,一天只能执行一次呢? 有什么方法解结呢? |
By [HNR] at 2005-8-30 22:02:25 |
hi,bruce,为什么没有下文呢? "那么该如何提取有用的返回信息,做过滤和调整呢?" |
By [hi] at 2005-10-15 18:31:51 |
ASP用XMLHTTP“偷”网页对网络带宽的要求太高了,速度稍微不行,整个服务器就会暂停。要是有多线程的就好了 |
By [tdk84e] at 2005-11-14 23:04:59 |
请教狼哥! 如果提取的信息是 <font size=2> 123456789 <font> 那么接下来怎么样只提取 "123456789" 呢?其他的内容不要! [Edit on 2005-11-28 15:16:11 By yeeho] |
By [yeeho] at 2005-11-28 15:12:06 |
http://www.dianping.com/????怎么不行 |
By [elylm] at 2005-12-30 9:49:53 |
[img]smile/face8.gif[/i |
By [d] at 2006-2-22 15:31:26 |
谢谢你的代码,让我找到的正确的方向可以解决问题,谢谢~~~~~~~~ |
By [aminic] at 2006-8-30 4:44:26 |
谢谢楼主的帖子,学习了。 |
By [猛男一号] at 2009-6-2 22:31:08 |