jeffersonchen
因特网是一个巨大的和迅速发展的信息资源。但大多数信息都是以无结构的文本形式存在,使得查询信息变得非常困难。网络数据抽取 是一个从目标网页中摘取某些数据形成统一的本地数据库的一个过程。这些数据本来只是在可见的网页中以文本形式存在。这个过程所需要的不仅仅是网页爬行器与网页包装器。
posted on 2006-12-04 15:18 jeffersonchen 阅读(4037) 评论(16) 编辑 收藏
Are you from CIC Data? you could reply me to eric@speed-china.com
not like that. perhaps you know something for that. I just do some search for the industry portal .
Powered by: Copyright © jeffersonchen