2009年1月21日星期三
2009年1月5日星期一
贴个技术文章──防火城墙升级版
注意这个软件的介绍,网络信息雷达系统,顾名思义就是比过去的GWF更加强大的工具,思科公司搞的那个耗费数亿元的系统只能被动防御,这个确实进攻型的。不光可以搜集HTML代码流里面的各种信息,还能收集PDF,Word文档,电子表格,演示文档,XML文档里面的信息。这个技术Google做得比较好,但是Google可能对个人数据并不是感兴趣。这个公司的方向可能跟google正好是相反的,这个专门用来搜集电子邮件,网页,附件之类的内容是不是有不“健康”或者不“文明”或者不“和谐”的内容。而且完全可以绕过网站中robots.txt对搜索爬虫的行为限制。这个跟百度搜索有异曲同工之妙。
不过有一点是Google也做不到的,那就是多语言内容的处理,例如这个软件说明书上声称,它可以处理中、英、日、韩、俄、法、西、德、阿拉伯语的信息处理。对于新八国联军的处理能力着实让谷歌颜面扫地,让雅虎无地自容。
这个系统号称可以准确过滤掉垃圾邮件,信息等。这里的垃圾的定义就有学问了。所以等以后发生丢信事件,你得琢磨琢磨是不是发了一些“垃圾信息”了。可能这个东西骨干网络上不需要,但是各地的政府部门和公安系统确实需要一套,这样象天涯这样的网站才没有炒作的素材,大家才有更多时间看看电视,看看CCTV,多了解一下天下大事,不用整天贴在电脑跟前,弄得家里关系紧张,夫妻不和,孩子没人照顾。
不过想一下,这得需要多少地方存储数据阿。如果实时处理的话,那需要多么强劲的处理能力啊,一年得需要多少电力啊。IDC的耗电量绝对是“不看不知道,世界真奇妙”的水平。(本文会不会被收入呢?一定会吧!)
=======================引用内容的分割线============================

TRS InfoRadar集信息采集监控、网络舆情、竞争情报等多种功能于一体,被广泛地应用于政府、媒体、科研、企业等各个行业中。
TRS InfoRadar在内容运营的垂直搜索应用、内容监管的网络舆情应用以及决策支持的竞争情报等方面的应用,将极大的提高组织对外部信息的获取效率,极大 降低信息采集成本,全方位掌控环境脉动,并提高各个组织的快捷反应效能。TRS InfoRadar让各行业的所有人员受益。

![]() |
产品概述 |
TRS网络信息雷达系统(TRS InfoRadar)实时监控和采集Internet网站内容,对采集到的信息自动进行过滤、分类和排重等智能化处理,最终将最新内容及时发布出来,实现统一的信息导航。同时提供包括全文、日期等在内的全方位信息查询。 网络信息雷达由三个逻辑模块组成: |
产品特色 |
双模服务1+1> 2 独立模式 SaaS模式 |
绿色节能搜索冲击波 绿色环保 节能先锋 |
产品架构 |
![]() |
产品功能 | |||||||||||||||||||||||||||||||||||||||||||||||||||
超群的信息采集 采集全面,采全率高
各类元数据准确采集 高效采集,性能超群 |
智能的信息处理 自动分类 自动排重 垃圾过滤 其它 |
及时的信息发布 一键式发布 可发布专题内容 |
快捷的信息检索 支持多语言网页的采集和检索 支持大量并发用户的查询请求 支持对多种属性的检索 快捷的检索速度 |
运行环境 | ||||||
|
MSN好歹有点进步了
确切说人家现在教windows live space,MSN Space是老掉牙的名字。
最近发现的改进有:
- 终于可以支持Firefox了
- 现在可以贴视频进来了,而且是原始的HTML代码
- 依此类推,js可能也可以贴进来,不过可能概率不大。很容易被IE乱执行,按照微软的一贯作风,识别所有html代码可能还是有难度的。
- 编辑框是全屏宽度的,跟Blogger相比看起来舒服一些。Google的想法是,编辑框和你的页面布局一样,这样看起来的长度和实际的一致。
- 在1024解析度下看上去还行,相对于大显示器,编辑页面还是太小。可能只有1000像素的高度。
- 自动保存功能,如果死机或者掉电就是前功尽弃
- HTML的预览可以说是一塌糊涂,没有断行也没有缩进。应该算是半成品。
- 微软总是假设用户都是白痴,所以高级一点的功能根本不需要。
- 载入页面的时候请求太多,看到地址栏那哗啦哗啦的闪,最少从5个不同的地方下东西,很容易造成内容缺失和卡壳。
- 页面不够简洁
- 竟然没有广告,不像微软作风
- 下头还要让用户参与举报不良信息,微软是不是该收购各做这方面内容的小公司