Shreyash Pandey // IBM 高级软件开发工程师(SDE 2)
我构建能在生产环境中存活的 AI 系统、自动化工作流与后端产品
我近期的工作处在应用型 AI 与工程纪律的交汇点:定位器自动修复、语义检索、内部 copilot、多语言模型训练,以及带有真实运维护栏的自动化管道。
- 5K+ 测试定位器实现自动修复
- 三层 ML 加 VLM 的恢复设计
- 斩获黑客松冠军的语义搜索
- 从零开始的开源模型训练
当前能力佐证面
作品集中最强的信号并非某个单一项目,而是 AI 恢复设计、服务可靠性与亲手构建模型这三者的结合,贯穿于工作项目与独立系统之中。
我所优化的方向
贯穿我全部工作的主线是在歧义中保持可靠。我喜欢那些需要推理、需要恢复、却仍能在运维上保持清晰可读的系统。
从最廉价且可靠的回退方案入手
我设计系统时先尝试确定性恢复,只有在确有必要时才升级到机器学习与基于模型的回退方案。
把评估当作产品的一部分
当系统包含 AI 时,度量闭环就不是可选项。我关注可观测的准确率、漂移、错误预算与失败分析。
我交付过的系统
2024 - Present
高级软件开发工程师(SDE 2)
IBM Software Labs · 印度班加罗尔
我在浏览器自动化与测试产品中设计并交付以可靠性为重的 AI 能力。这些工作融合了 embedding、视觉语言模型、服务拆分,以及大量的运维纪律。
2023 - 2024
软件工程师 2(Software Engineer 2)
Software AG (now IBM) · 印度班加罗尔
这一阶段让我更深入地投入 AI 产品工作:语义检索、内部 copilot,以及立足于实际产品需求而非演示的预测系统。
2022 - 2023
软件工程师(Software Engineer)
Software AG · 印度班加罗尔
我围绕 Java、Spring Boot 与 REST API 开发企业集成平台能力,打下的基础至今仍塑造着我思考生产系统的方式。
当前项目
2026 · 仅解码器语言模型
Phoenix 125M
一个 LLaMA 风格的 125M 参数模型,在单块 RTX 3080 Ti 上从零训练,配有自定义分词器、数据管道与训练循环。
2026 · 多语言语言模型
Sweta-Hi and Sweta-Kn
基于 LLaMA 风格架构的印地语与卡纳达语预训练工作,配有自定义分词器与端到端的多语言数据管道。
2026 · 微调 · 文本转 SQL
SQLForge: Mistral 7B QLoRA
一次 4-bit QLoRA 微调,把 Mistral 7B v0.3 变成可靠的文本转 SQL 模型。沿用训练 Phoenix 125M 的那块 12 GB GPU,预留 3.75 GB 显存余量;在首次 WikiSQL 运行暴露出指标失真后,重建了感知 schema 的评估流程。
查看全部成果