Henrik Sergoyan,德国巴伐利亚州慕尼黑的开发人员
Henrik is available for hire
Hire Henrik

Henrik Sergoyan

Verified Expert  in Engineering

数据科学家和机器学习开发人员

Location
慕尼黑,巴伐利亚,德国
至今成员总数
November 5, 2021

Henrik是一位拥有超过六年专业经验的数据科学家. 他的主要专长包括但不限于自然语言处理, 预测算法, 表格数据的梯度增强算法, data scraping, 和机器学习操作(MLOps). 作为一名资深数据科学家, Henrik使用SQL和NoSQL数据库, including MongoDB, 并为他的工作带来了强大的项目管理技能和卓越.

Portfolio

Toptal Client
Python,数据科学,MongoDB, Jupyter Notebook, ETL,数据可视化...
车站赌场有限责任公司-主要
机器学习,SQL, Python, Linux, RapidMiner, Windows...
Fozzy Group
Python, PyCharm, MySQL,时间序列分析...

Experience

Availability

Part-time

首选的环境

Windows, MacOS, Slack, PyCharm, Jupyter Notebook, Visual Studio Code (VS Code)

The most amazing...

...我开发了一个端到端的数据科学管道,它适用于亚美尼亚政府使用的两个不同平台.

Work Experience

高级数据科学顾问

2022 - 2022
Toptal Client
  • 在MongoDB中开发复合聚合管道,以处理给定集合中的大量嵌套文档.
  • 创建了一个系统,可以识别数据处理阶段的错误,其中结构化信息来自慈善组织的PDF报告. 在我的系统的帮助下,我们可以检测并修复数据库中的所有不一致.
  • 创建了一个用户友好的流光仪表板(MVP),作为用户的慈善导航. 我为每个慈善机构开发了交互式可视化(桑基图),显示了全年的资金流动(从收入到支出).
技术:Python,数据科学,MongoDB, Jupyter Notebook, ETL,数据可视化, Streamlit, Data, Data Analysis, API Integration, Analytics, 数据库管理, 统计编程, 统计建模, 情绪分析

机器学习专家

2021 - 2022
车站赌场有限责任公司-主要
  • 开发了一个系统,可以识别将要离开大楼的客户(在15分钟的间隔内), 考虑到描述客户过去和当前行为的42个变量.
  • 开发复杂的SQL查询,从SQL数据库中提取实时数据.
  • 使用RapidMiner部署将模型留在生产环境中的机会.
Technologies: 机器学习,SQL, Python, Linux, RapidMiner, Windows, 渐变增强树, Deep Learning, 深度神经网络, 预测学习, Data, Data Analysis, API Integration, Data Science, Analytics, NoSQL, 数据库管理, 统计编程, 统计建模, 情绪分析

高级数据科学家

2021 - 2021
Fozzy Group
  • 创建并实施促销产品的销售预测模型.
  • 部署一个促销预测模型,并为该模型实施一个监控系统.
  • 协助改善乌克兰最大的杂货店推荐系统, 包括特征工程和建模.
  • 为销售预测模型创建了Power BI仪表板,以分析错误.
  • 通过与相关涉众沟通来确定业务需求,从而领导模型部署, 创建系统架构, 并协助后端团队以最优化的方式部署我们的模型.
技术:Python, PyCharm, MySQL,时间序列分析, 机器学习操作(MLOps), 推荐系统, Microsoft Power BI, LightGBM, CatBoost, XGBoost, Graylog, RabbitMQ, Flask, REST, Windows, Slack, Jupyter Notebook, Data Mining, Data Engineering, SQL, ETL, Machine Learning, 人工智能(AI), 数据科学产品经理, Azure SQL, Ensemble Methods, BERT, TensorFlow, Data Science, Deep Learning, Keras, Statistics, PySpark, 亚马逊网络服务(AWS), Dashboards, RStudio Shiny, Tableau, 预测学习, 渐变增强树, Reporting, Data Analytics, Data Analysis, Data Reporting, Web Scraping, Time Series, BigQuery, 统计分析, Model Development, Pandas, PyTorch, 软件工程, Mathematics, 数据可视化, 源代码审查, Task Analysis, Interviewing, Data, API Integration, 预测分析, Analytics, NoSQL, 数据库管理, 统计编程, 统计建模, 情绪分析, NumPy

高级数据科学顾问

2019 - 2021
亚美尼亚国家可持续发展目标创新实验室|联合国开发计划署办事处
  • 开发了有史以来第一个人工智能驱动的实时工具travelinsights.数据分析,使用人工智能来收集数据, analyze, 并将Tripadvisor上关于亚美尼亚的旅游评论可视化, Facebook, and Booking.com.
  • 创建了实时平台Edu2Work,刮了60多个,000个在线欧博体育app下载, 从非结构化的职位描述中提取并标准化相关信息, 并在仪表板上显示分析结果.
  • 开发监控平台sdglab的数据科学部分.am/ zh /亚美尼亚可持续发展目标监测项目. 这是一个用户友好的、人工智能驱动的、开放访问的交互式在线数据分析工具.
  • 建立公民请求分类模型,提高亚美尼亚政府的运作效率, 将亚美尼亚公民提出的要求分配给相应的部委.
  • 管理一个数据科学团队. 从项目初期开始参与项目策划, 为每个任务制定了工作分解结构(WBS), 并管理数据科学团队和实验室主管之间的沟通.
技术:Python, 自然语言处理(NLP), 生成预训练变压器(GPT), GPT, TensorFlow, Google Cloud, BERT, Transformers, Zero-shot学习, Few-shot Learning, Word2Vec, Clustering, GRAPH, FbProphet, CATS Forecasting, Ensemble Methods, Data Scraping, ETL, MongoDB, Selenium, Social Media APIs, Project Design, Design Thinking, 敏捷项目管理, Windows, MacOS, Slack, PyCharm, Jupyter Notebook, Data Mining, 无监督学习, Data Engineering, 机器学习操作(MLOps), Machine Learning, 人工智能(AI), 数据科学产品经理, Data Science, 命名实体识别(NER), Deep Learning, Keras, Scikit-learn, Dashboards, RStudio Shiny, Linux, 预测学习, 渐变增强树, 深度神经网络, Reporting, Data Analytics, 谷歌云平台(GCP), Data Analysis, Data Reporting, Web Scraping, Time Series, 统计分析, Model Development, Pandas, PyTorch, 软件工程, Mathematics, 数据可视化, Technical Hiring, Code Review, 源代码审查, Task Analysis, Interviewing, Team Management, Data, API Integration, 预测分析, Office 365, Analytics, NoSQL, 数据库管理, 统计编程, 统计建模, 情绪分析, NumPy

Teaching Associate

2019 - 2020
亚美尼亚美国大学
  • 指导一组高年级学生完成他们的Capstone项目,专注于亚美尼亚房地产市场分析. 开发数据提取模型, 室内设计分类, 距离计算, 以及最优的价格估计.
  • 每周与20名理学士和理学硕士一起解决统计学课程的问题. 根据所讨论的主题,解释了一组独特问题的解决方案.
  • 协助创建自然语言处理和统计学课程的教学大纲和议程.
  • 指导学生完成顶点项目, 一些与房地产市场相关的新闻分析.
技术:统计数据, 贝叶斯统计, 生成预训练变压器(GPT), GPT, 自然语言处理(NLP), 大学教学, Supervisor, Real Estate, Web Scraping, Data Collection, BigQuery, 统计分析, PyTorch, Mathematics, Technical Hiring, Code Review, Task Analysis, Interviewing, Data, GIS, RStudio, 预测分析, Office 365, Sports, Data Science, Analytics, NoSQL, 数据库管理, 统计编程, 情绪分析, NumPy

Data Scientist

2018 - 2019
Ameriabank
  • 为银行员工创建并部署了一个基于人工智能的虚拟助手. 将银行内部沟通的操作效率降低了120%.
  • 开发金融市场指标、商品、价格和销售的预测算法.
  • 根据客户的交易和活动进行客户细分分析.
技术:Python, SQL, GPT, 生成预训练变压器(GPT), 自然语言处理(NLP), Windows, Slack, PyCharm, Jupyter Notebook, Data Mining, Data Scraping, 无监督学习, Data Engineering, ETL, Machine Learning, 人工智能(AI), Ensemble Methods, Zero-shot学习, BERT, TensorFlow, Google Cloud ML, Data Science, 命名实体识别(NER), Statistics, 贝叶斯统计, Scikit-learn, Dashboards, RStudio Shiny, Linux, 预测学习, 渐变增强树, Reporting, Data Analytics, 谷歌云平台(GCP), Sports, Data Analysis, Data Reporting, Web Scraping, Data Collection, Time Series, 统计分析, Model Development, Pandas, Mathematics, 数据可视化, Code Review, 源代码审查, Task Analysis, Team Management, RStudio, 预测分析, Office 365, Analytics, NoSQL, 数据库管理, 统计编程, 统计建模, 情绪分析, NumPy

数据科学家|统计学家

2017 - 2018
ClinChoice
  • 在数据库锁定之前准备SAS程序时发现数据集中的不一致.
  • 开发SAS程序生成表格, listings, 根据统计分析计划(SAP)中规定的规格绘制图表。.
  • Created, validated, 并根据适用的指导方针和客户的标准操作程序,通过良好的临床编程实践记录SAS程序.
Technologies: SAS, SAS SQL, Windows, Slack, Data Mining, ETL, Ensemble Methods, BERT, 贝叶斯统计, R, 预测学习, Reporting, Data Analytics, Data Analysis, Data Reporting, Web Scraping, Data Collection, 统计分析, Pandas, RStudio, 预测分析, Office 365, NoSQL, 数据库管理, 统计编程, 统计建模, 情绪分析, NumPy

劳动力市场信息平台| Edu2Work

http://edu2work.am/
Edu2Work平台的开发是为了应对劳动力市场的动态特性以及亚美尼亚人才需求和供应之间的持续不匹配. 该平台采用尖端的自然语言处理(NLP)模型来收集和分析来自一系列商业网站的数千个在线欧博体育app下载. By doing so, 它提供全面的, 亚美尼亚劳动力市场的最新数据, 使个人能够做出明智的职业决定.
Edu2Work的开发涉及到端到端的数据科学管道的设计和实现, 包含高效和灵活的数据摄取, 信息提取与标准化, 数据可视化. 项目期间执行的核心NLP任务包括根据欧洲标准进行职称标准化, 行业分类, 技能提取和分类(软/硬), 和学位提取(BSc), MSc, PhD, None). 这些任务有助于使该平台能够以用户友好和可访问的格式提供高质量的劳动力市场数据.

促销预测

In this project, 我开发了一个端到端管道,用于预测乌克兰最大的零售商店促销产品的销售模型. 该模型考虑了30多个特征,以准确预测促销计划中产品的销售情况. 在内部部署之后, 该模型提高了商务团队决定促销类型和数量的操作效率, 后勤团队, 在每个分支机构分配足够的资源.

旅游分析平台

http://www.travelinsights.ai/
我为亚美尼亚的旅游业开发了一个人工智能实时数据分析工具. 这个在线工具使用旅行故事和人工智能来收集信息, analyze, 并将Tripadvisor上关于亚美尼亚的旅游评论可视化, Facebook, and Booking.com. 通过实时分析和可视化的游客评论, 该工具揭示了亚美尼亚的实际旅行偏好和实际问题. With one scroll, policymakers, businesses, 或者游客可以从世界各地探索亚美尼亚不同地区和地点的见解.

Languages

Python, R, SQL, SAS

Frameworks

LightGBM, Selenium, RStudio Shiny, Flask

Libraries/APIs

CatBoost, XGBoost, Pandas, NumPy, TensorFlow, Keras, Scikit-learn, PyTorch, Social Media APIs, PySpark

Tools

Slack, PyCharm, 命名实体识别(NER), Visual Studio, Tableau, BigQuery, GIS, Microsoft Power BI, Graylog, RabbitMQ, Supervisor, AutoML

Paradigms

ETL,数据科学,设计思维,敏捷项目管理,REST,自动化

Platforms

MacOS, Jupyter Notebook, RStudio, Windows, Linux, Azure, 亚马逊网络服务(AWS), 谷歌云平台(GCP), Visual Studio Code (VS Code), RapidMiner

Storage

数据库管理,MongoDB, MySQL, Google Cloud, SAS SQL, NoSQL, Azure SQL

Other

Data Mining, Data Scraping, 自然语言处理(NLP), Word2Vec, FbProphet, Ensemble Methods, Machine Learning, 人工智能(AI), Deep Learning, Statistics, Dashboards, 渐变增强树, Reporting, Data Analytics, Fantasy Sports, Data Analysis, Data Reporting, Web Scraping, Data Collection, Time Series, 统计分析, Model Development, Mathematics, 数据可视化, Task Analysis, Interviewing, Data, 预测分析, Sports, Football, Analytics, 统计编程, 统计建模, 情绪分析, GPT, 生成预训练变压器(GPT), 无监督学习, Data Engineering, 计算统计数据, 机器学习操作(MLOps), Dash, 时间序列分析, BERT, Transformers, Zero-shot学习, Few-shot Learning, Project Design, 数据科学产品经理, 贝叶斯统计, 预测学习, 深度神经网络, 大学教学, Real Estate, Technical Hiring, Code Review, 源代码审查, Team Management, API Integration, Office 365, Google Cloud ML, 推荐系统, CATS Forecasting, 软件工程, Agile Data Science, Streamlit, Graphs, Clustering, GRAPH

2022 - 2022

Ph.D. 数据科学学位

亚美尼亚欧洲大学-埃里温

2020 - 2022

数据科学数学硕士学位

慕尼黑工业大学-慕尼黑,德国

2019 - 2021

统计学硕士学位

埃里温州立大学-埃里温

2015 - 2019

计算机科学学士学位

亚美尼亚美国大学-埃里温,亚美尼亚