已经有人提到了,提取好的feature才是最重要的,不管是svm, rf, gbm, deep learn, knn什么方法,没有strong feature就是一堆废物。
什么是好的特征?假设一个任务是判断男女:
1. 如果用头发的颜色作为feature,则基本等于猜; 2. 如果看外貌则可能命中率可能是90%(例如春哥可能被识别成汉子); 3. 如果用性染色体做特征则基本上保证100%的识别。
1、2、3这分别对应了弱,中,强分类feature,我们希望找到3,现实中常常只能找到1,2,甚至很多问题,我们都不知道3是否存在。因此,你除了play with data这块熟悉,更重要的是了解你的研究对象。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有