摘要:数据挖掘和统计学有很多共同点,但与此同时它们也有很多差异。它们的关系究竟如何?该文分别介绍了数据挖掘和统计学的含义,讨论了数据挖掘与统计学间的关系,介绍了在数据挖掘中常用的统计方法和存在的问题和前景。
摘要:Web服务是一种比较成熟的分布式计算技术,拥有自己特有的协议和运行模型,而p2p同样拥有一组成熟的协议和技术,该文简单介绍了p2p的Napster和Chord两种技术,并将其和Web服务技术结合讨论,类比两个领域的技术异同,借鉴Chord技术的优点,引入了语义信息对Web服务进行本体描述,建立了一个新的模型,设计了一种通过比较语义相似度来选择和组合分布在Chord环上的Web服务的算法模型,并对该模型的优缺点进行评价,讨论了一些改进的方法和未来的可能性。
摘要:支持向量机是机器学习和数据挖掘领域的热门研究课题之一,作为一种尚未完全成熟的技术,目前仍有许多不足,其中之一就是没有统一的模型参数选择标准和理论。在具体使用中,对支持向量机性能有重要影响的参数包括惩罚因子C,核函数及其参数的选取。文章首先分析了模型参数对支持向量机性能的影响,然后对几种常用的模型参数选择方法进行介绍,分析以及客观评价,最后概括了支持向量机模型参数选择方法的现状,以及对其发展趋势进行了展望。