博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Weka开发[4]-特征选择
阅读量:6548 次
发布时间:2019-06-24

本文共 2667 字,大约阅读时间需要 8 分钟。

  hot3.png

       特征选择,我对这一部分也不熟,大概讲一下,用AttributeSelection进行特征选择,它需要设置3个方面,第一:对属性评价的类(自己到Weka软件里看一下,英文Attribute Evaluator),第二:搜索的方式(自己到Weka软件里看一下,英文Search Method),第三:就是你要进行特征选择的数据集了。最后调用Filter的静态方法userFilter,感觉写的都是废话,一看代码就明白了。唯一值得一说的也就是别把AttributeSelection的包加错了,代码旁边有注释。

       另一个函数懒的解释了(它也不是我写的),基本上是自解释的,不太可能看不懂。

package instanceTest; import java.io.FileReader;import java.util.Random; import weka.attributeSelection.CfsSubsetEval;import weka.attributeSelection.GreedyStepwise;import weka.classifiers.Evaluation;import weka.classifiers.meta.AttributeSelectedClassifier;import weka.classifiers.trees.J48;import weka.core.Instances;import weka.filters.Filter;import weka.filters.supervised.attribute.AttributeSelection; public class FilterTest{    private Instances m_instances = null;        public void getFileInstances( String fileName ) throws Exception {        FileReader frData = new FileReader( fileName );        m_instances = new Instances( frData );                m_instances.setClassIndex( m_instances.numAttributes() - 1 );    }        public void selectAttUseFilter() throws Exception {        AttributeSelection filter = new AttributeSelection();  // package weka.filters.supervised.attribute!        CfsSubsetEval eval = new CfsSubsetEval();        GreedyStepwise search = new GreedyStepwise();        filter.setEvaluator(eval);        filter.setSearch(search);        filter.setInputFormat( m_instances );                System.out.println( "number of instance attribute = " + m_instances.numAttributes() );                Instances selectedIns = Filter.useFilter( m_instances, filter);        System.out.println( "number of selected instance attribute = " + selectedIns.numAttributes() );    }        public void selectAttUseMC() throws Exception {            AttributeSelectedClassifier classifier = new AttributeSelectedClassifier();         CfsSubsetEval eval = new CfsSubsetEval();         GreedyStepwise search = new GreedyStepwise();         J48 base = new J48();         classifier.setClassifier( base );         classifier.setEvaluator( eval );         classifier.setSearch( search );         // 10-fold cross-validation         Evaluation evaluation = new Evaluation( m_instances );         evaluation.crossValidateModel(classifier, m_instances, 10, new Random(1));         System.out.println( evaluation.toSummaryString() );    }        public static void main( String[] args ) throws Exception {        FilterTest filter = new FilterTest();                filter.getFileInstances( "F://Program Files//Weka-3-4//data//soybean.arff");        filter.selectAttUseFilter();                filter.selectAttUseMC();    } }

转载于:https://my.oschina.net/piorcn/blog/518340

你可能感兴趣的文章
数据库 之 MySQL的索引
查看>>
JS 获取随机颜色
查看>>
删除GoldenGate
查看>>
辞职后,五险一金如何处理
查看>>
全球域名注册商(国际域名)保有量及市场份额(6月1日)
查看>>
时序数据库连载系列: 时序数据库一哥InfluxDB之存储机制解析
查看>>
URI,URL,URN
查看>>
java HTTPClient PostMethod 中文乱码问题解决方法
查看>>
URL特殊字符需转义
查看>>
Horizon7发布完整克隆模式后,无法登录问题
查看>>
No default constructor for entity
查看>>
IBM DS存储多路径
查看>>
java网络编程01
查看>>
字符串处理 - ANSI - Unicode - UTF8 转换
查看>>
一个×××老鸟的十年一梦----绝对真实!欢迎拍砖!
查看>>
Windows7搭建FTP服务器要点
查看>>
Linux 系统资源查看
查看>>
分步LVS: 详解利用Keepalived+Nginx解决站点高可用性
查看>>
Cocos2d-x3.2 UserDefault用户数据
查看>>
kvm虚拟化
查看>>