Shreyash Pandey // IBM 高级软件开发工程师（SDE 2）

我构建能在生产环境中存活的 AI 系统、自动化工作流与后端产品

我近期的工作处在应用型 AI 与工程纪律的交汇点：定位器自动修复、语义检索、内部 copilot、多语言模型训练，以及带有真实运维护栏的自动化管道。

5K+ 测试定位器实现自动修复
三层 ML 加 VLM 的恢复设计
斩获黑客松冠军的语义搜索
从零开始的开源模型训练

当前能力佐证面

作品集中最强的信号并非某个单一项目，而是 AI 恢复设计、服务可靠性与亲手构建模型这三者的结合，贯穿于工作项目与独立系统之中。

恢复阶梯

3 tiers

先 CSS 选择器，再 embedding，当歧义仍然很高时上 IBM Granite 3.3 VLM。

运行时规模

4K-5K rpm

SAT 运行时被拆分为四个服务，具备亚秒级延迟与发布级别的运维约束。

模型履历

125M

Phoenix 125M 以及多语言预训练工作，均用自定义分词器与训练管道构建。

5K+ 测试定位器实现自动修复三层 ML 加 VLM 的恢复设计斩获黑客松冠军的语义搜索从零开始的开源模型训练

5K+ 测试定位器实现自动修复

4 SAT 运行时中的微服务

83% 回退模式下的 Chrome 准确率

70% 内部支持工单的减少

99.99% 由预测支撑的可用性

1st TechInterrupt 印度区第一

我所优化的方向

贯穿我全部工作的主线是在歧义中保持可靠。我喜欢那些需要推理、需要恢复、却仍能在运维上保持清晰可读的系统。

从最廉价且可靠的回退方案入手

我设计系统时先尝试确定性恢复，只有在确有必要时才升级到机器学习与基于模型的回退方案。

把评估当作产品的一部分

当系统包含 AI 时，度量闭环就不是可选项。我关注可观测的准确率、漂移、错误预算与失败分析。

我交付过的系统

2024 - Present

高级软件开发工程师（SDE 2）

IBM Software Labs · 印度班加罗尔

我在浏览器自动化与测试产品中设计并交付以可靠性为重的 AI 能力。这些工作融合了 embedding、视觉语言模型、服务拆分，以及大量的运维纪律。

2023 - 2024

软件工程师 2（Software Engineer 2）

Software AG (now IBM) · 印度班加罗尔

这一阶段让我更深入地投入 AI 产品工作：语义检索、内部 copilot，以及立足于实际产品需求而非演示的预测系统。

2022 - 2023

软件工程师（Software Engineer）

Software AG · 印度班加罗尔

我围绕 Java、Spring Boot 与 REST API 开发企业集成平台能力，打下的基础至今仍塑造着我思考生产系统的方式。

当前项目

2026 · 仅解码器语言模型

Phoenix 125M

一个 LLaMA 风格的 125M 参数模型，在单块 RTX 3080 Ti 上从零训练，配有自定义分词器、数据管道与训练循环。

PyTorchTransformersTokenization

查看模型卡

2026 · 多语言语言模型

Sweta-Hi and Sweta-Kn

基于 LLaMA 风格架构的印地语与卡纳达语预训练工作，配有自定义分词器与端到端的多语言数据管道。

Multilingual NLPData engineeringCustom tokenizers

查看模型卡

2026 · 微调 · 文本转 SQL

SQLForge: Mistral 7B QLoRA

一次 4-bit QLoRA 微调，把 Mistral 7B v0.3 变成可靠的文本转 SQL 模型。沿用训练 Phoenix 125M 的那块 12 GB GPU，预留 3.75 GB 显存余量；在首次 WikiSQL 运行暴露出指标失真后，重建了感知 schema 的评估流程。

QLoRAFine-tuningbitsandbytes

在 HuggingFace 上查看模型

查看全部成果

浏览完整的项目作品集

全部项目 →

正在寻找我的下一份工作

AI 系统工程师, 印度班加罗尔

我最感兴趣的是 AI 系统、后端工程与可靠性工作交汇的岗位。通常意味着 agent 基础设施、以评估为核心的产品工作、自动化平台或开发者工具。

联系我进一步了解我