Rudolf Eremyan,格鲁吉亚第比利斯的开发商
Rudolf is available for hire
Hire Rudolf

Rudolf Eremyan

Verified Expert  in Engineering

数据科学开发人员

Location
Tbilisi, Georgia
Toptal Member Since
August 2, 2018

Rudolf是一位在该领域有六年经验的数据科学家. 他为格鲁吉亚语言开发了第一个聊天机器人框架, 格鲁吉亚最大的银行是哪家. 鲁道夫为财富500强公司设计了基于云技术的大数据处理管道. 他被邀请担任国际黑客马拉松和会议(如PyData)的演讲者和评委, Google DevFest, 以及NASA的国际太空应用挑战.

Portfolio

Staude Capital
数据工程、Excel VBA、SQL、数据科学、亚马逊网络服务(AWS)...
ATH Digital LLC
Docker, Plotly, PostgreSQL, Jupyter Notebook, Pandas, AdWords API, Facebook API...
Zelos.AI
Amazon Elastic MapReduce (EMR)、PySpark、Jupyter、亚马逊网络服务(AWS)...

Experience

Availability

Part-time

Preferred Environment

亚马逊网络服务(AWS), Python, Big Data, Apache Airflow, PostgreSQL, SQL, PySpark, Data Modeling, Data Pipelines, Pandas

The most amazing...

...框架是为格鲁吉亚语言开发的聊天机器人框架.

Work Experience

云解决方案的数据工程师

2021 - PRESENT
Staude Capital
  • 根据客户提供的需求和业务需求设计数据模型.
  • 开发投资者CRM系统,用于管理对冲基金交易、订单和其他操作.
  • 创建自动化报告工具,并将其部署在亚马逊云服务上.
Technologies: 数据工程、Excel VBA、SQL、数据科学、亚马逊网络服务(AWS), Hedge Funds, Python, Pandas, Data Modeling, Docker

Data Scientist

2020 - 2021
ATH Digital LLC
  • 创建数据摄取脚本,用于从Adwords和Facebook广告等广告平台提取数据.
  • 开发基于AWS服务的CSV和Excel文件数据自动上传到数据库.
  • 搭建数据处理管道的营销流云基础架构.
  • 根据数据科学团队的需求,设计了数据库模型.
  • 创建了一个模型,用于预测和可视化平衡燃烧率指标.
Technologies: Docker, Plotly, PostgreSQL, Jupyter Notebook, Pandas, AdWords API, Facebook API, Cron, Python, Amazon Kinesis, Amazon EC2, Docker Compose, Jupyter, Google Analytics API, Apache Airflow, Big Data, 亚马逊网络服务(AWS)

Senior Data Scientist

2019 - 2020
Zelos.AI
  • 在AWS EMR上使用PySpark处理和分析了超过1亿个运动成绩数据.
  • 根据公司业务需求设计了数据模型.
  • 制作了一个由气流编排的批量数据处理管道.
  • 使用Scrapy, Selenium, lxml创建了一个数据抓取工具,用于解析动态和静态网页.
  • 开发了基于蒙特卡罗方法的田径比赛模拟.
技术:Amazon Elastic MapReduce (EMR)、PySpark、Jupyter、亚马逊网络服务(AWS), Statistics, Data Science, Amazon DynamoDB, Amazon EC2, lxml, Data Modeling, Database Modeling, Code Architecture, Markov Model, 马尔科夫链蒙特卡罗(MCMC)算法, Scrapy, DB, Data Scraping, Selenium, Data Engineering, Machine Learning, 生成预训练变压器(GPT), 自然语言处理(NLP), GPT, ETL, Docker, Python, Apache Airflow, Pandas, Big Data

Data Scientist

2018 - 2019
Windsor.AI
  • 优化了现有的SQL查询,使其更简单,性能更高.
  • 使用SQL获取见解,检测收集数据中的异常和问题.
  • 为不同数据库管理系统之间的数据迁移创建了一个工作流.
  • 开发脚本,用于从不同的在线广告平台获取数据.
  • 根据分析团队的需求设计新的数据库表.
Technologies: Jupyter, DB, Marketing, Google Analytics, PostgreSQL, SQL, Statistics, R, Pandas, Python, Docker, Facebook API, AdWords API, Big Data, 亚马逊网络服务(AWS)

Data Scientist

2018 - 2019
边疆数据公司
  • 开发了Twitter流趋势检测模型.
  • 开发基于ai的应用架构.
  • 将内部机器学习模型与IBM BlueMix和谷歌cloud NLP等云服务集成.
  • 使用谷歌BigQuery处理大数据集.
  • 为新的ML模型评估创建了自定义模块.
  • 训练机器学习模型用于文本分类.
  • 为现有应用程序创建测试.
Technologies: Jupyter, DB, Time Series Analysis, R, 生成预训练变压器(GPT), GPT, 自然语言处理(NLP), Big Data, Python, Pandas, Docker, PostgreSQL, 亚马逊网络服务(AWS)

Data Scientist

2016 - 2018
Pulsar AI
  • 应用机器学习和自然语言处理(NLP)技术为格鲁吉亚语言开发了聊天机器人框架.
  • 训练并部署了一个机器学习模型,用于对来自格鲁吉亚媒体网站的新闻和文章进行自动分组.
  • 设计了一个基于社交网络文本的情感分类工具.
  • 运用自然语言处理对大量用户对话数据进行分析, 统计并给出了精确的结果.
  • 使用时间序列分析和预测加密货币价格.
  • 管理一个语言学家团队,负责数据收集和标注.
Technologies: Jupyter, DB, MongoDB, Git, Docker, NumPy, Pandas, SpaCy, fastText, 自然语言工具包(NLTK), Gensim, Scikit-learn, Python, PostgreSQL, 亚马逊网络服务(AWS)

软件开发人员实习

2016 - 2016
Virtuace Inc.
  • Fixed bugs.
  • 扩展现有应用程序的功能.
  • Tested new modules.
技术:XML, Java, Git, Linux, Docker

全栈软件工程师

2014 - 2016
格鲁吉亚技术大学
  • 开发管理和使用语言语料库的前端.
  • 创建了用于操作语言语料库数据的web服务.
  • 有组织的数据库结构,用于存储和操作语言语料库.
  • 使用NLP工具分析文档,并以清晰的方式呈现结果.
Technologies: DB, Python, 自然语言工具包(NLTK), Linguistics, MySQL, REST, JavaScript, CSS, HTML, PostgreSQL

趋势检测在推特流

利用自然语言处理算法与时间序列分析方法相结合,开发了Twitter流早期趋势检测模型.
使用Twitter API开发提取和分析Twitter流的脚本.

用不同的图将分析结果可视化,以便更好地解释.

营销优化的归因建模

归因建模是一种用于衡量一段通信对实际业务目标的货币影响的方法, for example, sales, customer retention, revenue, and profit.

在这个项目中,我广泛地使用SQL进行数据操作和分析, 以及Python和R库. 我开发了数据迁移和客户端通知脚本. Also, 已实现的数据完整性测试,用于检查现有数据的完整性和正确性. 与分布在世界各地的国际团队合作.

Advanced News Filter

使用谷歌BigQuery分析新闻大数据集.

训练了用于文本过滤机制的文本分类机器学习模型. 将IBM BlueMix和谷歌cloud NLP等云机器学习服务与现有应用程序集成.

格鲁吉亚语聊天机器人框架

http://www.facebook.com/TBCTIbot/
Ti-Bot,有史以来第一个会说格鲁吉亚语的聊天机器人.

自动新闻文章分组工具

新闻文章分组工具将词向量化技术与聚类算法相结合,对从新闻网站解析的相似文章进行自动分组.

社交媒体情感分析工具

社交媒体情绪分析工具是自然语言处理技术和机器学习算法的结合,用于预测评论和帖子的情绪, 从Facebook和Instagram等社交网络收集的数据.

格鲁吉亚语拼写检查器

拼写检查工具使用经典算法,结合强大的机器学习和自然语言处理方法来检测和纠正句子中的错误. 该产品被格鲁吉亚最大的公司用于检测和纠正文件中的错误.

加密货币价格监控工具

加密货币价格监控工具使用时间序列分析算法和Tweeter API与情感分析等NLP工具相结合, 用于监控和预测比特币和其他加密货币的价格走势.

格鲁吉亚方言自动识别的自然语言处理工具

用于自动识别来自不同来源(如论坛)的文档中的格鲁吉亚方言的工具, social networks, etc. 它基于机器学习分类方法和自然语言处理方法. During development, 我和一群语言学家一起工作,他们为分类模型准备训练和评估数据.

该项目荣获“第比利斯国立大学第76届学生大会最佳科研成果”。

语料库管理系统

开发了一个用于存储、操作和分析语言数据的web应用程序.

用于制药行业数据的ETL管道

与客户团队合作,为制药行业建立新的数据库, by collecting, 清理和管理来自不同来源的数据. 使用AWS服务实现ETL、存储日志等.

模拟2020年东京奥运会

解析分析大量运动员成绩数据. 应用蒙特卡罗统计方法对运动员成绩数据进行模拟田径比赛. 使用AWS云服务运行计算并存储生成的结果.

Languages

Python, SQL, XML, JavaScript, Java, HTML, CSS, R, Bash, Excel VBA

Libraries/APIs

Pandas, Beautiful Soup, REST APIs, XGBoost, SciPy, NumPy, SpaCy, Scikit-learn, 自然语言工具包(NLTK), Twitter API, PySpark, Google AdWords, Matplotlib, Google Cloud API, AdWords API, Facebook API, Google Analytics API

Tools

Trello, Jupyter, GitHub, Gensim, Apache Airflow, pgAdmin, Bitbucket, Git, Cron, Plotly, Amazon Elastic MapReduce (EMR), Google Analytics, Docker Compose, Spark SQL

Paradigms

数据科学,ETL, Scrum, REST,数据库设计

Platforms

Jupyter Notebook、Docker、亚马逊网络服务(AWS)、Linux、Amazon EC2

Storage

PostgreSQL, MySQL, DB, MongoDB, Database Modeling, Amazon DynamoDB, Redshift, Data Lakes, Data Pipelines

Other

Data Scraping, Big Data, Data Engineering, Machine Learning, Text Classification, Text Mining, Data Analysis, Data Analytics, Batch File Processing, Predictive Analytics, Apache Superset, Regular Expressions, Web Scraping, Clustering Algorithms, Topic Modeling, Web Services, Data Mining, Attribution Modeling, Data Visualization, Reporting, Trading, 自然语言处理(NLP), 马尔科夫链蒙特卡罗(MCMC)算法, Markov Model, Code Architecture, Data Modeling, lxml, fastText, Linguistics, Time Series Analysis, SSH, 计算语言学, Statistics, Data Structures, Algorithms, IBM Cloud, Amazon Kinesis, Hedge Funds, GPT, 生成预训练变压器(GPT)

Frameworks

Selenium, Flask, Scrapy, Spark

Industry Expertise

Marketing, Healthcare

2013 - 2017

计算机科学学士学位

第比利斯国立伊凡·贾瓦希什维利大学-格鲁吉亚第比利斯

JUNE 2022 - PRESENT

数据分析

Udacity

MAY 2020 - PRESENT

AWS认证解决方案架构师协会2020

CloudGuru

2019年8月至今

营销分析与R

Datacamp.com

2018年12月- 2019年12月

谷歌分析个人资格

数字广告学院

JULY 2017 - PRESENT

深度学习暑期学校

University of Deusto

2017年1月至今

深度学习

Udacity

2016年2月至今

机器学习在线课程

Stanford University

2016年2月至今

语言与现代技术

法兰克福歌德大学/美因