【导读】本文介绍了包括图像分类、交易预测、情感分类、推荐系统、股票预测等在内的若干个机器学习应用及数据集。
作者:Michiel Mulders
1. 鸢尾花分类
Iris Flowers数据集被视为ML的“Hello World”,因为它是分类的典型例子。这个数据集的好处是它只有四个属性:花瓣长度,花瓣宽度,萼片长度和萼片宽度,可加载到内存中。
该项目涉及使用四种已知特的不同种类的鸢尾花。
分类类型?这里使用多类分类。这意味着我们应该能够准确地预测数据点属于哪个类。
目标:根据花的特性对三种花进行分类:花瓣和萼片的尺寸。
鸢尾花数据集
http://archive.ics.uci.edu/ml/datasets/Iris
完整指南:
https://machinelearningmastery.com/machine-learning-in-python-step-by-step/
2. 交易预测
GNY的小组发布了一个演示程序,展示了该平台如何通过其强大的神经网络预测零售交易组,并且该平台的完全可下载和可定制版本将在今年夏天推出。GNY将有一个可选择的机器学习代码集库,可以根据每个人的要求进行选择,并可以应用于他们的侧链(因为GNY将使用Lisk的侧链技术)。
为什么这个这么重要?几乎所有企业都在寻找一种经济实惠的方式来挖掘其数据中的隐藏价值,但是如果它将它们暴露给安全风险则不会。区块链的固有结构有助于控制数据一致性,并保持对数据的控制
性能提高,因为在前一个块仍处于活动状态时,已经可以为后续块启动验证。验证包括检查用户是否有足够的余额。只有错误预测的交易,才需要重做这项工作。
这个演示是一个有趣的入门项目,适合想要预测简单数字的人,今年夏天推出的完整平台应该为开发人员提供更多功能和定制。可以在MLWave找到一个好的数据集,用于使用购买历史来预测重复购买者。
目标:根据支出历史预测未来交易。
3. Twitter的情感分析
机器学习的一个有趣应用是情感分析。随着加密货币的兴起,情绪分析取得了重大突破。许多人试图建立包含情绪分析的交易机器人,以做出更好的交易决策。
还有许多其他平台可用于情绪分析,如Reddit,Facebook或LinkedIn,因为它们都提供易于使用的API来检索数据。但是,由于Twitter平台上数据的格式一致,这是机器学习的首选数据。由于推文主要由文本,URL和主题标签组成,因此预处理也更容易。
Twitter API知道许多可用于集成到项目中的API库。可以使用!pip install python-twitter通过pip安装Python的包装器。
分析几个有趣的例子:
围绕新发布的电影的评论,并将其与IMDB和其他评级网站上的评论进行比较。
围绕特定选举或任何其他趋势政治话题的情绪。
根据推文的情绪预测前50种加密货币价格的未来方向。
目标:情绪分析器学习一段内容背后的各种情绪。此任务可帮助您考虑设计各种模型以将推文标记为正面或负面。在后期阶段,我们可以用更加细致的方式标记推文,如“中性”,“愤怒”,“乐观”,......
Github概述:所有与Twitter相关的数据集
https://github.com/shaypal5/awesome-twitter-data
4.使用Movielens的推荐系统
推荐系统是机器学习技术在商业中最成功和最广泛的应用之一。您可以在日常生活中随处找到推荐系统。例如,在观看Youtube视频时,Youtube算法会根据您的观看习惯向您推荐视频,同时也会根据观察运行ML算法的模式对全世界人们的观看行为提出关键见解。
我们可以为推荐系统找到两种算法:
基于内容:它寻找内容的相其与其他人进行比较以找到类似的行为/喜好。下图说明了这一点。
目前,Movielens提供了最受欢迎的电影评级数据集之一,这是初学者试验的理想数据集。
目标:根据评分,预测用户喜欢哪些电影。
网站:Grouplens.org
教程:Towardsdatascience提供了使用Python构建简单的推荐系统的教程。
https://towardsdatascience.com/how-to-build-a-simple-recommender-system-in-python-375093c3fb7d
5. Quandl股票价格预测
股票价格预测器是一个了解公司业绩并预测未来股票价格的系统。股票价格预测的问题是可以使用许多类型和数据来源:
波动率指数
历史价格
全球宏观经济指标
基本面分析
使用指标的技术分析
分析股票市场的好处是它具有更短的反馈周期,这使得更容易验证您的预测。如果您不了解市场周期,我建议您阅读有关此主题的内容,以了解典型周期的情况。
为了简单起见,您可以选择一个简单的机器学习示例,如根据组织的季度报告预测6个月的价格变动。
目标:使用基本和技术指标预测未来价格。
下载:Quandl.com或Quantoplan.com的股票市场数据集。
原文链接:
https://hackernoon.com/top-5-machine-learning-projects-for-beginners-47b184e7837f
-END-
专 · 知
专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎登录www.zhuanzhi.ai,注册登录专知,获取更多AI知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程视频资料和与专家交流咨询!
请加专知小助手微信(扫一扫如下二维码添加),加入专知人工智能主题群,咨询技术商务合作~
专知《深度学习:算法到实战》课程全部完成!530+位同学在学习,现在报名,限时优惠!网易云课堂人工智能畅销榜首位!
点击“阅读原文”,了解报名专知《深度学习:算法到实战》课程
玻璃钢生产厂家常德不锈钢雕塑厂家吕梁玻璃钢坐凳制造淄博玻璃钢种植池哪家好吕梁玻璃钢种植池定制清远不锈钢家具黑龙江玻璃钢景观雕塑定制宜宾玻璃钢装饰造型定制台湾玻璃钢垃圾桶厂家直销山东玻璃钢花槽哪家好焦作玻璃钢前台生产厂家大连不锈钢花盆生产厂家宁德玻璃钢花坛批发杭州玻璃钢浮雕厂家海南玻璃钢设备外壳批发陕西玻璃钢景观雕塑价格合肥玻璃钢座椅厂家海南玻璃钢生产厂家徐州玻璃钢医疗外壳生产厂家南充玻璃钢家具定制宝鸡玻璃钢垃圾桶制作毕节玻璃钢树池坐凳厂家直销眉山玻璃钢坐凳价格锦州玻璃钢花坛多少钱鹰潭玻璃钢坐凳哪家好陕西玻璃钢家具铜仁玻璃钢餐桌椅公司南阳玻璃钢花槽公司遵义玻璃钢装饰生产厂家梧州玻璃钢花坛制造南充玻璃钢花槽批发香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声单亲妈妈陷入热恋 14岁儿子报警汪小菲曝离婚始末遭遇山火的松茸之乡雅江山火三名扑火人员牺牲系谣言何赛飞追着代拍打萧美琴窜访捷克 外交部回应卫健委通报少年有偿捐血浆16次猝死手机成瘾是影响睡眠质量重要因素高校汽车撞人致3死16伤 司机系学生315晚会后胖东来又人满为患了小米汽车超级工厂正式揭幕中国拥有亿元资产的家庭达13.3万户周杰伦一审败诉网易男孩8年未见母亲被告知被遗忘许家印被限制高消费饲养员用铁锨驱打大熊猫被辞退男子被猫抓伤后确诊“猫抓病”特朗普无法缴纳4.54亿美元罚金倪萍分享减重40斤方法联合利华开始重组张家界的山上“长”满了韩国人?张立群任西安交通大学校长杨倩无缘巴黎奥运“重生之我在北大当嫡校长”黑马情侣提车了专访95后高颜值猪保姆考生莫言也上北大硕士复试名单了网友洛杉矶偶遇贾玲专家建议不必谈骨泥色变沉迷短剧的人就像掉进了杀猪盘奥巴马现身唐宁街 黑色着装引猜测七年后宇文玥被薅头发捞上岸事业单位女子向同事水杯投不明物质凯特王妃现身!外出购物视频曝光河南驻马店通报西平中学跳楼事件王树国卸任西安交大校长 师生送别恒大被罚41.75亿到底怎么缴男子被流浪猫绊倒 投喂者赔24万房客欠租失踪 房东直发愁西双版纳热带植物园回应蜉蝣大爆发钱人豪晒法院裁定实锤抄袭外国人感慨凌晨的中国很安全胖东来员工每周单休无小长假白宫:哈马斯三号人物被杀测试车高速逃费 小米:已补缴老人退休金被冒领16年 金额超20万