一聚教程网:一个值得你收藏的教程网站

热门教程

搜索引擎在网络信息挖掘中的应用-搜索引擎技术

时间:2022-07-02 20:25:37 编辑:袖梨 来源:一聚教程网

     随着网络信息资源的急剧增长,人们越来越多地关注如何快速有效地从海量的网络信息中,抽取出潜在的、有价值的信息,使之有效地在管理和决策中发挥作用。搜索引擎技术解决了用户检索网络信息的困难,目前搜索引擎技术正成为计算机科学界和信息产业界争相研究、开发的对象。本文旨在探讨搜索引擎技术在网络信息挖掘方面的应用。
 
    一、数据挖掘的研究现状
    讨论网络信息挖掘,首先要从传统的数据挖掘谈起。
 
    1、什么是数据挖掘
    根据W.J.Frawley和G.P.Shapiro等人的定义,数据挖掘是指从大型数据库的数据中提取人们感兴趣的知识,而这些知识是隐含的、事先未知的、潜在的有用信息。原始数据可以是结构化的,如关系型数据库中的数据;也可以是半结构化的,如文本、图形、图像数据;甚至是分布在网络上的异构型数据。数据挖掘的方法可以是数学的,也可以是非数学的;可以是演绎的,也可以是归纳的。挖掘出来的信息可以被用于信息管理、决策支持、过程控制等,还可用于数据自身的维护。因此,数据挖掘是一门广义的交叉学科,它汇聚了不同领域的研究者,尤其是数据库、人工智能、数理统计、可视化、并行计算等方面的学者和工程技术人员。
 
    2、数据挖掘的研究现状
    目前,国外在数据挖掘方面的发展趋势及研究主要有:对知识发现方法的进一步研究,如近年来注重对Bayes(贝叶斯)方法以及Boosting方法的研究和提高;统计学回归法在KDD中的应用;KDD与数据库的紧密结合;对网络信息挖掘方法的研究等。国外很多计算机公司非常重视数据挖掘的开发应用,IBM和微软都成立了相应的研究中心,一些公司的相关软件也开始在国内销售,如Platinum、BO以及IBM。
 
    国内从事数据挖掘研究的人员主要在大学,也有部分在研究所或公司。所涉及的研究领域很多,一般集中于学习算法的研究、数据挖掘的实际应用以及有关数据挖掘理论方面的研究。目前进行的大多数研究项目是由政府资助进行的,如国家自然科学基金、863计划、“九五“计划等。
 
    可以看出,数据挖掘的研究和应用受到了学术界、实业界和政府部门的越来越多的重视。
 
    3、数据挖掘的分类及其工具

热门栏目