所有工程主题
胡安·曼纽尔·奥尔蒂斯·德·萨拉特
胡安·曼纽尔·奥尔蒂斯·德·萨拉特
胡安·曼纽尔·奥尔蒂斯·德·萨拉特
推特数据挖掘:使用Python进行大数据分析的指南
推特是一座数据的金矿. 与其他社交平台不同的是,几乎每个用户的推文都是完全公开的、可拉的.
在本教程中, Toptal自由软件工程师安东尼Sistilli将探索如何使用Python, 推特 API, 以及收集有用数据的数据挖掘技术.
8分钟阅读继续阅读
安东尼Sistilli
Apache Spark流媒体教程:识别推特趋势标签
社交网络是当今最大的数据来源之一, 这意味着他们是营销人员极其宝贵的资产, 大数据专家, 甚至是像记者和其他专业人士这样的个人用户. 利用实时推特数据的潜力在许多对时间敏感的业务流程中也很有用.
在本文中, 顶级自由软件工程师Hanee ' Medhat解释了如何构建一个简单的Python应用程序来利用Apache Spark的强大功能, 然后用它来阅读和处理推文,以识别热门话题标签.
10分钟阅读继续阅读
Hanee' Medhat Shousha
预测社会网络分析的数据挖掘
分析人士已经认识到,社交网络数据是一个虚拟的信息宝库,可以用来感知民意趋势和民意支持的浪潮. 在本文中, Toptal工程师老人桑托斯描述了他用于概念验证的技术,该技术有效地分析了推特趋势主题并进行了预测, 作为示例测试用例, 2014年巴西总统大选的地区投票模式.
7分钟阅读继续阅读
老人桑托斯
世界级的文章,每周发一次.