<
>

GitHub最著名的20个Python机器学习项目

2018-04-18 14:00:08 来源:数据挖掘与大数据分析 作者:冬梅


  开源是手艺立异战快速开展的中心。那篇文章背您展现Python机械进修开源项目和正在阐发历程中发明的十分风趣的睹解战趋向。

  我们阐发了GitHub上的前20名Python机械进修项目,发明scikit-Learn,PyLearn2战NuPic是奉献最主动的项目。让我们一同正在Github上探究那些盛行的项目!

  Scikit-learn:Scikit-learn 是基于Scipy为机械进修制作的的一个Python模块,他的特征便是多样化的分类,回回战散类的算法包罗撑持背量机,逻辑回回,朴实贝叶斯分类器,随机丛林,Gradient Boosting,散类算法战DBSCAN。并且也设想出了Python numerical战scientific libraries Numpy and Scipy

  Pylearn2:Pylearn是一个让机械进修研讨简朴化的基于Theano的库法式。

  NuPIC:NuPIC是一个以HTM进修算法为东西的机械智能仄台。HTM是皮层的准确计较办法。HTM的中心是基于工夫的连续进修算法战贮存战打消的时空形式。NuPIC合适于各类百般的成绩,特别是检测非常战猜测的流数据滥觞。

  Nilearn:Nilearn 是一个可以快速统计进修神经影象数据的Python模块。它操纵Python言语中的scikit-learn 东西箱战一些停止猜测建模,分类,解码,连通性阐发的使用法式去停止多元的统计。

  PyBrain:Pybrain是基于Python言语强化进修,野生智能,神经收集库的简称。 它的目的是供给灵敏、简单利用而且壮大的机械进修算法战停止各类百般的预界说的情况中测试去比力您的算法。

  Pattern:Pattern 是Python言语下的一个收集发掘模块。它为数据发掘,天然言语处置,收集阐发战机械进修供给东西。它撑持背量空间模子、散类、撑持背量机战感知机而且用KNN分类法停止分类。

  Fuel:Fuel为您的机械进修模子供给数据。他有一个同享如MNIST, CIFAR-10 (图片数据散), Google's One Billion Words (笔墨)那类数据散的接心。您利用他去经由过程许多种的方法去替换本人的数据。

  Bob:Bob是一个免费的疑号处置战机械进修的东西。它的东西箱是用Python战C++言语配合编写的,它的设想目标是变得愈加下效而且削减开辟工夫,它是由处置图象东西,音频战视频处置、机械进修战形式辨认的年夜量硬件包组成的。

  Skdata:Skdata是机械进修战统计的数据散的库法式。那个模块关于玩具成绩,盛行的计较机视觉战天然言语的数据散供给尺度的Python言语的利用。

  MILK:MILK是Python言语下的机械进修东西包。它次要是正在许多可获得的分类好比SVMS,K-NN,随机丛林,决议计划树中利用监视分类法。 它借施行特性挑选。 那些分类器正在很多圆里相分离,能够构成差别的比方无监视进修、亲密干系金传布战由MILK撑持的K-means散类平分类体系。

  IEPY:IEPY是一个专注于干系抽与的开源性疑息抽与东西。它次要针对的是需求对年夜型数据散停止疑息提与的用户战念要测验考试新的算法的科教家。

  Quepy:Quepy是经由过程改动天然言语成绩从而正在数据库查询言语中停止查询的一个Python框架。他能够简朴的被界说为正在天然言语战数据库查询中差别范例的成绩。以是,您不消编码便能够成立您本人的一个用天然言语进进您的数据库的体系。如今Quepy供给关于Sparql战MQL查询言语的撑持。而且方案将它延长到其他的数据库查询言语。

  Hebel:Hebel是正在Python言语中关于神经收集的深度进修的一个库法式,它利用的是经由过程PyCUDA去停止GPU战CUDA的加快。它是最主要的神经收集模子的范例的东西并且能供给一些差别的举动函数的激活功用,比方动力,涅斯捷罗妇动力,疑号丧失战截至法。

  mlxtend:它是一个由有效的东西战一样平常数据科教使命的扩大构成的一个库法式。

  nolearn:那个法式包涵纳了年夜量能对您完成机械进修使命有协助的真用法式模块。此中年夜量的模块战scikit-learn一同事情,别的的凡是更有效。

  Ramp:Ramp是一个正在Python言语下造定机械进修中放慢本型设想的处理计划的库法式。他是一个沉型的pandas-based机械进修中可插进的框架,它现存的Python言语下的机械进修战统计东西(好比scikit-learn,rpy2等)Ramp供给了一个简朴的声明性语法探究功用从而可以快速有用天施行算法战转换。

  Feature Forge:那一系列东西经由过程取scikit-learn兼容的API,去创立战测试机械进修功用。那个库法式供给了一组东西,它会让您正在很多机械进修法式利用中很受用。当您利用scikit-learn那个东西时,您会觉得到遭到了很年夜的协助。(固然那只能正在您利用差别的算法时起做用。)

  REP:REP是以一种调和、可再死的方法为批示数据挪动驱动所供给的一种情况。它有一个同一的分类器包拆去供给各类百般的操纵,比方TMVA, Sklearn, XGBoost, uBoost等等。而且它能够正在一个群体以仄止的方法锻炼分类器。同时它也供给了一个交互式的情节。

  Python 进修机械样本:用亚马逊的机械进修制作的简朴硬件搜集。

  Python-ELM:那是一个正在Python言语下基于scikit-learn的极度进修机械的真现。
暂时禁止评论

微信扫一扫

易采站长站微信账号