Shreyash Pandey // IBM 高级软件开发工程师(SDE 2)

我构建能在生产环境中存活的 AI 系统、自动化工作流与后端产品

我近期的工作处在应用型 AI 与工程纪律的交汇点:定位器自动修复、语义检索、内部 copilot、多语言模型训练,以及带有真实运维护栏的自动化管道。

  • 5K+ 测试定位器实现自动修复
  • 三层 ML 加 VLM 的恢复设计
  • 斩获黑客松冠军的语义搜索
  • 从零开始的开源模型训练

当前能力佐证面

作品集中最强的信号并非某个单一项目,而是 AI 恢复设计、服务可靠性与亲手构建模型这三者的结合,贯穿于工作项目与独立系统之中。

恢复阶梯
3 tiers
先 CSS 选择器,再 embedding,当歧义仍然很高时上 IBM Granite 3.3 VLM。
运行时规模
4K-5K rpm
SAT 运行时被拆分为四个服务,具备亚秒级延迟与发布级别的运维约束。
模型履历
125M
Phoenix 125M 以及多语言预训练工作,均用自定义分词器与训练管道构建。
5K+ 测试定位器实现自动修复三层 ML 加 VLM 的恢复设计斩获黑客松冠军的语义搜索从零开始的开源模型训练
5K+ 测试定位器实现自动修复
4 SAT 运行时中的微服务
83% 回退模式下的 Chrome 准确率
70% 内部支持工单的减少
99.99% 由预测支撑的可用性
1st TechInterrupt 印度区第一

我所优化的方向

贯穿我全部工作的主线是在歧义中保持可靠。我喜欢那些需要推理、需要恢复、却仍能在运维上保持清晰可读的系统。

从最廉价且可靠的回退方案入手

我设计系统时先尝试确定性恢复,只有在确有必要时才升级到机器学习与基于模型的回退方案。

把评估当作产品的一部分

当系统包含 AI 时,度量闭环就不是可选项。我关注可观测的准确率、漂移、错误预算与失败分析。

我交付过的系统

2024 - Present

高级软件开发工程师(SDE 2)

IBM Software Labs · 印度班加罗尔

我在浏览器自动化与测试产品中设计并交付以可靠性为重的 AI 能力。这些工作融合了 embedding、视觉语言模型、服务拆分,以及大量的运维纪律。

2023 - 2024

软件工程师 2(Software Engineer 2)

Software AG (now IBM) · 印度班加罗尔

这一阶段让我更深入地投入 AI 产品工作:语义检索、内部 copilot,以及立足于实际产品需求而非演示的预测系统。

2022 - 2023

软件工程师(Software Engineer)

Software AG · 印度班加罗尔

我围绕 Java、Spring Boot 与 REST API 开发企业集成平台能力,打下的基础至今仍塑造着我思考生产系统的方式。

当前项目

2026 · 仅解码器语言模型

Phoenix 125M

一个 LLaMA 风格的 125M 参数模型,在单块 RTX 3080 Ti 上从零训练,配有自定义分词器、数据管道与训练循环。

PyTorchTransformersTokenization
查看模型卡

2026 · 多语言语言模型

Sweta-Hi and Sweta-Kn

基于 LLaMA 风格架构的印地语与卡纳达语预训练工作,配有自定义分词器与端到端的多语言数据管道。

Multilingual NLPData engineeringCustom tokenizers
查看模型卡

2026 · 微调 · 文本转 SQL

SQLForge: Mistral 7B QLoRA

一次 4-bit QLoRA 微调,把 Mistral 7B v0.3 变成可靠的文本转 SQL 模型。沿用训练 Phoenix 125M 的那块 12 GB GPU,预留 3.75 GB 显存余量;在首次 WikiSQL 运行暴露出指标失真后,重建了感知 schema 的评估流程。

QLoRAFine-tuningbitsandbytes
在 HuggingFace 上查看模型

查看全部成果

浏览完整的项目作品集

正在寻找我的下一份工作

AI 系统工程师, 印度班加罗尔

我最感兴趣的是 AI 系统、后端工程与可靠性工作交汇的岗位。通常意味着 agent 基础设施、以评估为核心的产品工作、自动化平台或开发者工具。