Web挖掘是一种信息收集形式,适用于从在线来源收集的数据。从Internet上的数据源收集数据允许用户聚合大量信息进行分析,以便在在线环境中做出关键的业务决策。例如,研究人员可以使用web挖掘来收集有关web内容中特定关键...
Web挖掘是一种信息收集形式,适用于从在线来源收集的数据。从Internet上的数据源收集数据允许用户聚合大量信息进行分析,以便在在线环境中做出关键的业务决策。例如,研究人员可以使用web挖掘来收集有关web内容中特定关键字使用情况的信息。或者,零售商和其他营销专业人员使用在线数据挖掘来发现web流量的趋势,即网站访问者向买家的转化,

对于营销专业人士来说,网络挖掘提供了与营销活动相关的丰富用途。
,对数据进行分类和分析,web挖掘模仿了传统的数据挖掘活动。相比之下,web挖掘活动关注的是基于web的信息,而不是像离线计算机数据库、客户记录或硬拷贝会计数据这样的大量信息源,传统的数据挖掘通常会发生这种情况。仅关注从在线来源收集的数据可以为在线营销策略、网站结构决策和类似的电子商务相关决策提供有针对性的分析。通过网络挖掘收集数据还可以为广泛的国际市场提供额外的好处人口统计,由于研究人员和信息收集者都可以访问来自世界各地的网站。

从互联网上收集的数据允许用户为在在线环境中进行关键业务决策的分析
从专业角度讲,web挖掘分为三类:web结构挖掘、使用情况挖掘和web内容挖掘,每个领域都关注特定信息,如特定网站的结构和超链接、有关访问者使用情况的服务器日志信息,网站分析软件包和服务是web使用挖掘的一个主要例子,它为网站管理员提供有关访问者流量、使用的搜索结果、单击的链接以及与特定页面交互所花时间的信息。另一方面,结构挖掘,提供有关特定网站内部结构的详细信息,包括超链接、数据库和查询功能。
对于营销专业人士来说,web挖掘提供了与营销活动相关的丰富用途。了解网站访问者如何使用特定网站,竞争对手如何建立竞争网站,以及什么内容已经在线的信息是有价值的信息。这些信息有助于关键决策者根据先前证明的技术和记录的信息制定营销策略。
高校还通过验证学生论文的唯一性和不抄袭的软件来利用web挖掘。使用web内容挖掘原则上,这样的评分助手在整个互联网上搜索相似的内容。教师上传学生文档的文本,然后指导剽窃软件在线检查互联网上是否有相似的短语或复制的文本。结果通常以匹配文本的百分比表示。提供了任何类似结果的链接允许教师访问网站,以确定比赛是否真的是剽窃。