Alex is available for hire

Alex Burlacu

验证专家 in Engineering

机器学习开发人员

Location

Chișinău，基希讷乌，摩尔多瓦

至今成员总数

May 24, 2022

Over the years, 作为一个经验丰富的机器学习工程师, 亚历克斯处理各种各样的问题, 从计算机视觉到自然语言处理和时间序列预测. 他曾多次作为一名工程师参与这个项目, 尽管缺乏数据和计算资源, 别人失败的地方他成功了. 过去几年，他一直担任机器学习团队的负责人. 在业余时间，Alex喜欢从事独立演讲和ML研究.

人工智能(AI)机器学习 Deep Learning 自然语言处理(NLP)Python 3 Python Git Scikit-learn Docker REST APIs 计算机视觉 FastAPI 提示工程 Ubuntu JSON Coding MLOps

Portfolio

ClearML

Python 3, PyTorch, ClearML, Amazon EC2, AWS CLI, Amazon S3 (AWS S3)...

DevelopmentAid

敏捷软件开发，Bash, Python 3, Docker, Docker Compose, PyTorch...

巴黎北部索邦大学

自我监督学习，学习，Terraform，谷歌云，Ansible...

Experience

Python 3 - 7年机器学习- 6年 Scikit-learn - 6年 Docker - 5年深度学习- 5年 PyTorch - 4年机器学习操作(MLOps) - 4年团队指导- 3年

Availability

Part-time

首选的环境

Ubuntu, Python 3, Visual Studio Code (VS Code)， Git, Docker, PyTorch, 神经网络

最神奇的...

...我做的是一个主动学习的多语言BERT模型，用于文档标记，以识别投标属性并加快文档处理速度.

工作经验

Software Lead

2023年至今

ClearML

领导clearpt项目的实施, 为企业培训和部署自托管llm的一组无代码工具. 我在不同阶段积极塑造项目的设计和路线图(MVP), Demo, 和客户PoC).
在AWS G5实例上调整和部署多个基于llama和FLAN-T5的模型，以获得最佳性价比. 也与多gpu和多节点训练使用HuggingFace加速.
构建工具来生成Q&来自文档页面的数据集, 一个支持rag的数据集生成管道, 还有一个定制的训练器，它会对表现最差的样本进行过度采样，以迫使模型更多地关注于提高难样本的表现.
领导ClearML SDK团队，负责开发特性并确保包的开源和企业版本的及时发布. 我积极参与未来版本特性的优先级排序和计划.
参与社区和企业支持活动. 进行技术培训，并积极建议客户如何最好地利用ClearML和clearpt, 考虑到它们独特的约束和要求.

技术:Python 3, PyTorch, ClearML, Amazon EC2, AWS CLI, Amazon S3 (AWS S3), Multi-GPU培训, 机器学习, 大型语言模型(llm), LLaMA, Flan-T5, 问题一代, Q&A Bots, 生成预训练变压器(GPT), Docker, 设计模式, 检索增强生成(RAG), Debugging, Python, OpenAI GPT-3 API, 图形处理器(GPU), 生成式人工智能(GenAI), 语言模型, 提示工程, Fine-tuning, Data Synthesis, 人工智能(AI), 亚马逊网络服务(AWS)

机器学习团队负责人

2019 - 2022

DevelopmentAid

在文档上使用机器学习(ML)和深度学习进行自然语言处理(NLP)，使数据输入更高效.
开发和生成多个ML微服务, 包括使用PyTorch和BERT通过命名实体识别对文档进行分类和标记, 另一个是利用scikit-learn处理不平衡的多输出文本分类.
定义并编写了用于命名实体识别(NER)的快速数据注释和合成数据充实的程序. 将数据集大小从少量注释良好的文档增加到100多个.
指导新机器学习模型的开发和实现实践，如机器学习代码审查, 交叉验证, 以及可复制的实验.
定义了一些MLOps实践，主要与使用Ray Serve的模型服务和使用MLflow的实验跟踪有关.
建立可观察的基础设施，以减少未报告错误的数量，并将bug发现时间从几天缩短到大约10分钟. 使用机甲和ELK，帮助收养普罗米修斯和格拉凡纳.
定义并记录部署过程，并将部署训练模型的时间减少到10分钟以内. 管理一个Jenkins实例，并使用Jenkins管道.
已建立的代码审查, 定期一对一会议, 明确的编码最佳实践, 以及像迭代计划这样的敏捷过程, planning poker, 站立会议, 将功能周期时间减少5倍，每次迭代的新bug减少到0.3.
自2020年7月起，领导由三名初级工程师组成的团队开发自动数据输入解决方案, 开发和部署新的ML模型, 处理我们的可观察性和CI基础设施.

Technologies: 敏捷软件开发，Bash, Python 3, Docker, Docker Compose, PyTorch, RabbitMQ, Ray, Python, Flask, FastAPI, Jenkins, 詹金斯管道, Scikit-learn, Jaeger, Prometheus, Grafana, 机器学习操作(MLOps), 生成预训练变压器(GPT), GPT, 自然语言处理(NLP), Deep Learning, Transformers, MLflow, Team Mentoring, 机器学习, Python 2, 人工智能(AI), JSON, 团队的领导, Pandas, Data Science, Hugging Face, BERT, 神经网络, REST APIs, Fine-tuning, DevOps, 图形处理器(GPU), 语言模型

研究实习生

2021 - 2021

巴黎北部索邦大学

提高了深度学习算法的样本效率, 混合技术从自我监督, semi-supervised, 并且少镜头学习适用于图像和其他数据源.
使用谷歌Colab笔记本电脑进行实验，然后切换到谷歌云平台. 配备了Terraform和Ansible, 使用一个bash命令在一到两分钟内创建图形处理单元(GPU)工作器和跟踪服务器.
采用MLFlow进行实验跟踪，结合Papermill和Optuna进行超参数优化.

Technologies: 自我监督学习，学习，Terraform，谷歌云，Ansible, Few-shot学习, MLflow, Hyperparameter优化, Optuna, Python 3, Python, 机器学习, 人工智能(AI), 计算机视觉, 机器学习操作(MLOps), PyTorch, Deep Learning, 神经网络, Fine-tuning, DevOps, 图形处理器(GPU), Research

大学助理

2019 - 2021

摩尔多瓦技术大学

重新创建并教授网络编程课程和两个专注于并发原语和网络协议的实验项目.
撰写并讲授实时编程课程和三个涉及基于消息的并发性的实验项目, 包括演员模型和CSP, 以及面向消息的集成模式和协议，如MQTT和XMPP.
全面检查和领导分布式系统和网络编程课程和实验室. 更新实时编程课程并讲授.
涵盖了分布式系统课程中的各种主题, 比如数据处理系统, 分布式数据库, 微服务设计模式, 以及分布式系统的主要问题, 就像共识一样, time, 而且只送一次.
Mentored five final-year students for their semester project; two of them chose me as their bachelor thesis supervisor. 每学期领导40多名学生的实验室.

技术:长生不老药, Python 3, HTTP, HTTP 2, 传输控制协议(TCP), RabbitMQ, Docker, Actor Model, Erlang, Scala, 消息队列, 并行编程, REST, HATEOAS, Mentorship, 分布式系统, Microservices, Python, REST APIs

Summer Intern

2018 - 2018

Cern

作为副合伙人参与EP-SFT小组, 获得英国科学技术设施委员会(STFC)的资助.
开发了一个项目，针对针对高能物理(HEP)的多层感知器，对TMVA包针对TensorFlow的逐事件推理性能进行基准测试。.
搜索ROOT科学包的TMVA子包的瓶颈和未来优化方向.
Concluded that, for one-by-one and small batch (< 32) inference modes, TMVA比TensorFlow 1快两个数量级.8、使用c++推理API从启用AVX512的源代码构建.
在布加勒斯特EEML 2019暑期学校的一次会议上展示了关于这项工作的海报.

技术:c++, Bash, Docker, ROOT, TensorFlow, Keras, Bazel, Python 3, Python, 机器学习, Deep Learning, 神经网络

机器学习工程师

2017 - 2018

氧化还原娱乐

研究开发用于体外受精卵母细胞医学图像分析的神经网络. 使用自动编码器预训练和自监督学习的连体网络等技术，创建了十多个定制的神经网络架构.
指导并培养了一位博士.D. 实习三个月后成为团队一员，也参与深度学习相关项目.
为小型企业开发了专门的体系结构, 低方差医学图像数据集，其性能与谷歌的AutoML Vision相当.
调试了一个预处理数据问题，泄漏了测试集，错误地在评估过程中给出了非常高的准确性. 防止发布损坏的模型，从而挽救了公司的声誉.

技术:Bash, TensorFlow, Docker, Keras, Scikit-image, 计算机视觉, Self-supervised学习, Deep Learning, 机器学习, 医学成像, Team Mentoring, Python 3, Python, OpenCV, 人工智能(AI), 图像处理, SQL, Data Science, 神经网络, Fine-tuning, 图形处理器(GPU), Research

联合创始人兼首席技术官

2017 - 2017

BookVoyager

开发基于搜索和内容的小说推荐系统，从原始文本中提取特征，并根据这些特征提供推荐.
实现日志记录，以便更快地进行故障排除，并将体系结构定义为多服务系统.
利用SpaCy构建了基于令牌级和全文分析的特征提取和推荐子系统.
参与客户访谈, 定义了业务和开发过程, 并在不同的场所推销这个项目.
通过使用预分配数组将推荐结果的计算速度提高85倍，并使用性能分析来识别瓶颈.

技术:Python 3, Python, Unit Testing, SpaCy, Scikit-learn, MongoDB, Flask, REST, XML-RPC, Git, 情绪分析, 生成预训练变压器(GPT), 自然语言处理(NLP), GPT, JSON, REST APIs

Experience

Serverless平台

我从零开始设计并实现了一个无服务器平台, 一个使用Python的AWS Lambda, FastAPI, and Docker. With Vue.js中，我为它编写了一个基本的UI. 该平台允许在Docker容器中创建和运行任意Python代码.

以丰富其功能, 我添加了一些其他服务，比如RabbitMQ, Minio, PostgresSQL, MongoDB, 和Apache Tika. 让它更容易使用, 我编写了一个类似API网关的服务, TCP服务器将HTTP请求转换为消息，并将响应作为HTTP响应发送回调用方.

这个项目后来成为一门独立讲授的分布式系统设计课程的基础. 这是一门免费课程，有25名学生参加，其中11人获得结业证书.

亚历克斯的偶尔博客文章|个人博客

http://alexandruburlacu.github.io

在我的个人博客里, 托管在GitHub上, 我主要写关于高级机器学习和深度学习技术的文章, 还包括我所掌握的一些重要知识, 比如分布式系统, 灵丹妙药的语言, 并发性和并行性, 以及与高级工程师和团队领导相关的主题.

我用杰基尔创造了它, 自定义一些模板, 并增加了谷歌分析和谷歌标签管理器.

用于人工智能研究的轻量级MLOps模板

一套工具，用于加快在云基础设施上运行和跟踪多个DL/AI实验的过程, 特别调优了spot实例，以降低模型迭代的总体成本. 为了使该工具易于与Jupyter一起使用，它具有自定义的MLFlow日志记录. 它使用Papermill和Optuna的组合，以最小的调整在Jupyter笔记本上运行超参数优化.

摩尔多瓦国家Python和人工智能课程

http://mecc.gov.md/sites/default/files/curriculum_ia_aprobat_cnc.pdf

我是为高中生开发国家人工智能课程的小组协调员. 作为努力的一部分, 我们形成了课程的结构，使其对高中生有吸引力. 我用罗马尼亚语制作了包括14门课程笔记和练习笔记本在内的教育材料. 作为课程的一部分, 学生将了解人工智能的主要应用, 简要了解计算机视觉和自然语言处理的人工智能, 然后学习主要的机器学习算法, 然后是线性代数的基础知识和探索性数据分析. Finally, 人工智能的各种社会和非技术方面包括围绕自动驾驶汽车的法律和社会问题, deep fakes, 人脸识别技术, and LLMs.

Skills

Languages

Python 3, Python, Elixir, Bash, SQL, c++， C, Python 2, Lisp, HTML, CSS, Java 8, Erlang, Scala

Libraries/APIs

Scikit-learn, REST api, PyTorch, TensorFlow, 詹金斯管道, Pandas, Keras, Vue, OpenCV, SpaCy

Tools

Git, Docker Compose, RabbitMQ, Jekyll, 谷歌分析, Jenkins, Grafana, Scikit-image, Terraform, Ansible, Bazel, Helm, BigQuery, AWS CLI, Amazon弹性容器服务(Amazon ECS)

Paradigms

REST，数据科学，函数式编程，DevOps，单元测试，面向对象分析 & Design (OOAD), 面向对象编程(OOP), 敏捷软件开发, Serverless架构, 并行编程, Actor Model, Microservices, 设计模式

Platforms

Docker, Ubuntu, Kubernetes, Jupyter笔记本, 谷歌云平台(GCP), Visual Studio Code (VS Code), Amazon EC2, 亚马逊网络服务(AWS)

Other

Deep Learning, 机器学习, 机器学习操作(MLOps), 自然语言处理(NLP), 人工智能(AI), 神经网络, GPT, 生成预训练变压器(GPT), Fine-tuning, 语言模型, 大学教学, Team Mentoring, FastAPI, Self-supervised学习, Learning, 计算机视觉, 团队的领导, Hugging Face, BERT, 图形处理器(GPU), 生成式人工智能(GenAI), 提示工程, Data Synthesis, 分布式系统, 云计算, MinIO, Serverless, 传输控制协议(TCP), HTTP, Coding, HATEOAS, Ray, Jaeger, Prometheus, Transformers, MLflow, 医学成像, Few-shot学习, Hyperparameter优化, Optuna, ROOT, HTTP 2, 消息队列, Mentorship, 图像处理, 情绪分析, Kustomize, 工程数据, ClearML, Multi-GPU培训, 大型语言模型(llm), LLaMA, Flan-T5, 问题一代, Q&机器人，检索增强生成(RAG)， OpenAI GPT-3 API，调试，研究

Frameworks

Flask

Storage

JSON, Google Cloud, MongoDB, XML-RPC, PostgreSQL, Amazon S3 (AWS S3)

Education

2019 - 2021

计算机科学硕士学位

斯特凡塞尔马雷大学- Suceava，罗马尼亚

2019 - 2021

计算机科学硕士学位

摩尔多瓦技术大学基希讷乌，摩尔多瓦

2015 - 2019

计算机科学学士学位

摩尔多瓦技术大学基希讷乌，摩尔多瓦

Certifications

2022年12月- 2024年12月

谷歌云认证专业机器学习工程师

Google Cloud

2022年12月- 2024年12月

谷歌云认证专业云架构师

Google Cloud

2022年6月- 2025年6月

认证Kubernetes应用开发人员(CKAD)

云原生计算基金会(CNCF)

2022年6月至今

深度学习工程师

Workera

有效的合作

如何使用Toptal

在数小时内，而不是数周或数月，我们的网络将为您直接匹配全球行业专家.

分享你的需求

在与Toptal领域专家的电话中讨论您的需求并细化您的范围.

选择你的才能

在24小时内获得专业匹配人才的简短列表，以进行审查，面试和选择.

开始你的无风险人才试验

与你选择的人才一起工作，试用最多两周. 只有当你决定雇佣他们时才付钱.

对顶尖人才的需求很大.

Start hiring