UCI机器学习数据库使用说明(转)数据库不断更新至2010年,是所有学习人工智能都需要用到的数据库,是看文章、写论文、测试算法的必备工具。数据库种类涉及生活、工程、科学各个领域,记录数也是从少到多,最多达几十万条。UCI数据可以使用matlab的dlmread或textread读取,不过,需要先将不是数字的类别用数字,比如1/2/3等替换,否则读入不了数值,当字符了。UCI数据库使用说明转自:/thread-37-1-(后面以简短的列表形式进行的注释),这些数据已经或能用于评价学习算法。每个数据文件(*.data)包含以“属性-值”对形式描述的很多个体样本的记录。对应的*.info文件包含的大量的文档资料。(有些文件_generate_databases;他们不包含*.data文件。)作为数据集和领域知识的补充,在utilities目录里包含了一些在使用这一数据集时的有用资料。地址/~mlearn/,这里的UCI数据集可以看作是通过web的远程拷贝。作为选择,这些数据同样可以通过ftp获得,ftp://。可以在pub/machine-learning-databases目录中找到。注意:UCI一直都在寻找可加入的新数据,ing子目录中。希望您能贡献您的数据,并提供相应的文档。谢谢——贡献过程可以参考DOC-REQUIREMENTS文件。目前,多数数据使用下面的格式:一个实例一行,没有空格,属性值之间使用逗号“,”隔开,并且缺少的值使用问号“?”表示。并请在做出您的贡献后提醒一下站点管理员:ml-******@:ucidata\iris中有三个文件:,列出了本文件夹里的所有文件,如iris中index的内容如下:,内容如下:,,,,Iris-,,,,Iris-,,,,Iris-setosa……,,,,Iris-,,,,Iris-,,,,Iris-versicolor……,,,,Iris-,,,,Iris-,,,,Iris-virginica……如上,属性直接以逗号隔开,中间没有空格(,,,,),最后一列为本行属性对应的值,即决策属性Iris-setosa。,如数据标题、数据来源、以前使用情况、最近信息、实例数目、实例的属性等,如下所示部分:……:
uci数据库使用说明 来自淘豆网m.daumloan.com转载请标明出处.