招聘职位:Python/大语言模型实习生
1.工作地点:北京
2.招聘人数:2人
3.实习周期:3个月及以上(长期优先)
4.工作时间:每周至少4天
岗位职责
1.参与基于Python的数据采集系统开发,实现多源数据自动化获取
2.运用OCR技术(PaddleOCR/Tesserac/olmOCR等)处理各类文档与图像数据
3.开发基于大模型(LLM)的文档理解与信息抽取功能
4.参与构建RAG(检索增强生成)系统,优化文档问答效果
5.协助完成数据处理pipeline的设计与优化
任职要求
1.计算机/人工智能相关专业在校生
2.扎实的Python编程能力
3.熟悉常用数据结构与算法
4.熟悉Scrapy/Requests等爬虫框架
5.掌握OpenCV/Pillow等图像处理库
6.了解PyPDF2/pdfplumber等文档解析工具
7.有使用deepseek/文心一言等大模型API的经验
8.具备大模型训练基础,了解Transformer架构原理,有使用PyTorch进行模型微调(如LoRA/P-tuning)或分布式训练的实际经验
加分项
1.有实际数据采集项目经验
2.参与过文档识别相关开发
3.了解LangChain等LLM应用框架
4.熟悉Docker基本使用
简历请发至:lvyk@cnis.ac.cn(邮件标题格式:姓名+年龄+学历+应聘职位名称)
招聘职位:Python/大语言模型实习生
1.工作地点:北京
2.招聘人数:2人
3.实习周期:3个月及以上(长期优先)
4.工作时间:每周至少4天
岗位职责
1.参与基于Python的数据采集系统开发,实现多源数据自动化获取
2.运用OCR技术(PaddleOCR/Tesserac/olmOCR等)处理各类文档与图像数据
3.开发基于大模型(LLM)的文档理解与信息抽取功能
4.参与构建RAG(检索增强生成)系统,优化文档问答效果
5.协助完成数据处理pipeline的设计与优化
任职要求
1.计算机/人工智能相关专业在校生
2.扎实的Python编程能力
3.熟悉常用数据结构与算法
4.熟悉Scrapy/Requests等爬虫框架
5.掌握OpenCV/Pillow等图像处理库
6.了解PyPDF2/pdfplumber等文档解析工具
7.有使用deepseek/文心一言等大模型API的经验
8.具备大模型训练基础,了解Transformer架构原理,有使用PyTorch进行模型微调(如LoRA/P-tuning)或分布式训练的实际经验
加分项
1.有实际数据采集项目经验
2.参与过文档识别相关开发
3.了解LangChain等LLM应用框架
4.熟悉Docker基本使用
简历请发至:lvyk@cnis.ac.cn(邮件标题格式:姓名+年龄+学历+应聘职位名称)