这是Python3.2安装scikit-learn机(jī)器(qì)学习包下载(zǎi),scikit-learn 机器学习包,很好的工具。但是官方网站(zhàn)没有适合python3.x的,在(zài)国(guó)外unofficial网(wǎng)站(zhàn)下载。
(网址(zhǐ)见我的博文python、数(shù)据收集、数据分(fèn)析) numpy、scipy、scikit-learn三个已打(dǎ)包,顺(shùn)序逐个安装。
Python3.2安装scikit-learn机器学习包是(shì)机器学(xué)习算(suàn)法在近几年大数据点燃的热(rè)火熏陶下已经变(biàn)得被人所“熟知”,就算(suàn)不懂(dǒng)得其中各算法理论,叫(jiào)你喊(hǎn)上一两(liǎng)个(gè)著(zhe)名算法的名(míng)字(zì),你(nǐ)也能昂首挺胸脱口而出。当然了,算法之林虽(suī)大,但能(néng)者还(hái)是有(yǒu)限,能适应(yīng)某些环境并取得较好(hǎo)效(xiào)果的算法会脱颖而出,而表(biǎo)现平平者则被历史所淡忘(wàng)。随着机器学习社(shè)区(qū)的(de)发(fā)展和实践验证,这群脱颖而出者也(yě)逐渐被人(rén)所(suǒ)认可和青睐,同时(shí)获得了更多社区力量(liàng)的支持、改进和推广(guǎng)。
以最广泛的分类(lèi)算法为例,大致可以分(fèn)为线性(xìng)和非线性两大派别。线(xiàn)性(xìng)算法有著名的逻辑回归、朴素贝(bèi)叶斯(sī)、最(zuì)大熵等(děng),非线性算(suàn)法有随(suí)机森(sēn)林、决策树(shù)、神经网络、核机器等等。线性算法举的大旗是训(xùn)练(liàn)和预测的效率比较高(gāo),但最终效果对特征的依赖程度(dù)较高,需要数据在特征层面上是线(xiàn)性可分(fèn)的。因此,使用线性(xìng)算法需要(yào)在特征工(gōng)程上下不少功夫,尽量对特(tè)征进行选(xuǎn)择、变换(huàn)或者组合(hé)等使(shǐ)得特征(zhēng)具有区分性。而非线性算法则(zé)牛逼点(diǎn),可以建(jiàn)模复杂的(de)分类面,从(cóng)而能更好的(de)拟合数(shù)据。
那在我们选择了(le)特(tè)征的(de)基础上,哪个机器学习算法能(néng)取得(dé)更好的(de)效(xiào)果呢?谁(shuí)也不知道(dào)。实践是检验哪个(gè)好的不二标准。那难道要苦逼(bī)到写五六个机器学习的代码吗?No,机器学习社区的力量(liàng)是强大的,码农(nóng)界的共(gòng)识是不(bú)重复(fù)造轮子!因此,对某些较为成熟(shú)的算法,总有(yǒu)某(mǒu)些优(yōu)秀的库可以直接使(shǐ)用,省去了(le)大(dà)伙调(diào)研的大部(bù)分时间。
基于目前使(shǐ)用python较(jiào)多,而python界中远(yuǎn)近闻名的机器学习库要数scikit-learn莫属了。这(zhè)个(gè)库优点很多。简单易用,接口抽象得非常(cháng)好,而且文档支(zhī)持实(shí)在感人。本(běn)文中,我们可以封装(zhuāng)其中的很(hěn)多机(jī)器学习算法,然后进行(háng)一次性测试,从而(ér)便于分析(xī)取优(yōu)。当然了,针对具体(tǐ)算法,超参(cān)调优也非常重(chóng)要(yào)。
Python3.2安装scikit-learn机器(qì)学习(xí)包是Python的一个开源机器学习模块,它建(jiàn)立在(zài)NumPy,SciPy和matplotlib模块之上。值得一提(tí)的是,scikit-learn最先是由David Cournapeau在2007年发起的一个(gè)Google Summer of Code项目(mù),从那时(shí)起这个项目就已经拥有很(hěn)多的(de)贡献者了(le),而且该(gāi)项目目前(qián)为止也是由一个志(zhì)愿者团队在(zài)维(wéi)护着。
scikit-learn的安(ān)装方法有很多种,而且也是(shì)适用于各(gè)种主流操作(zuò)系统,scikit-learn主(zhǔ)页上也分别详细地介绍了在不同操作系(xì)统(tǒng)下的三种安装方法,具体(tǐ)安装详(xiáng)情请移步至 installing scikit-learn。
在这里,首先向(xiàng)大家推荐一(yī)款学习Python的(de)强大的开发环境python(x,y)。python(x,y)是一个基于python的(de)科(kē)学计算(suàn)软件包,它包含集(jí)成开发环境(jìng)Eclipse和Python开发插(chā)件pydev、数据交互式(shì)编辑(jí)和可视化工具spyder,而且还(hái)内嵌了Python的基础数据(jù)库numpy和高级数学库scipy、3D可视化工(gōng)具集MayaVi、Python界面(miàn)开发库PyQt、Python与C/C++混合编译器SWIG。除此之外,python(x,y)配备(bèi)了丰富齐全的帮助文(wén)档,非常方便科研人员使用。
对于像楼主这样,在(zài)学校习惯了用Matlab仿(fǎng)真搞科研的学生而言(yán),python(x,y)是学习Python的一个(gè)绝佳选择,其(qí)中(zhōng)内嵌的spyder提(tí)供(gòng)了类似于Matlab的(de)交互界面,可(kě)以很方(fāng)便地使用(yòng)。python(x,y)的下载(zǎi)请点击(jī)这里:python(x,y)下载(zǎi)。
由(yóu)于scikit-learn是基于(yú)NumPy、SciPy和matplotlib模块的,所以在(zài)安装scikit-learn之前必须(xū)要(yào)安装这3个模块(kuài),这就很麻烦。但是,如果你提(tí)前像楼(lóu)主这样安装了python(x,y),它(tā)本(běn)身已经包含(hán)上述的模块,你只需下载与你匹配的scikit-learn版本,直接点(diǎn)击安装(zhuāng)即(jí)可。
scikit-learn各种版本下(xià)载:scikit-learn下载。
