PMML-Association rule

Posted: June 29th, 2010 | Author: laomi | Filed under: 论文读后感 | Tags: | No Comments »

PMML (Predictive Model Markup Language)是被20多个支持者和组织支持的数据挖掘和统计模型的主流标准,现在已经有一些主流的数据分析和挖掘工具已经支持了PMML,例如: SPSS, Weka等。

PMML is the leading standard for statistical and data mining models and supported by over 20 vendors and organizations. With PMML, it is straightforward to develop a model on one system using one application and deploy the model on another system using another application.

对于模型的描述我们知道,模型就像是一个黑盒子,你给它数据,它给你想得到的数据。例如对于一个分类器来说,一旦你将这个分类器已经训练好了,那么新的一条数据从这个模型的输入之后,模型会返回一个输出,告诉你所输入的这条数据时属于哪一类的。其实PMML其实就是数据统计和挖掘,这么个模型能够被多个软件使用,一旦你在一个软件中训练好一个模型,这个模型将会被支持PMML软件或者是应用复用,这个也是PMML的一个目的。

标题我取的是PMML-Association rule,其实是最近自己在写一个关于运用PMML去表达Association rule的例子,以及如何去扩展这个PMML。对于任何一个模型来说,都有它的输入和输出,在PMML中输入和输出已经表达好了,所以自己在这里只是去了解了一下它,没有进一步的去解读它的schema,在这里侧重点是对Association Rule Model的描述,从目前自己从PMML的官方网站上对的描述摘录如下:

Association rule Model
Read the rest of this entry »