[分享创造] 分享一个用腾讯云开发的彩票验奖小程序,聊聊 OCR + LLM 的组合实践
·
背景 之前帮家人买过几次彩票,验奖时发现体验挺麻烦的:要么去投注站扫描,要么手动一个个核对号码。作为程序员当然想到能不能写个工具解决,于是就有了这个小程序项目。 技术选型上选择了微信小程序 + 腾讯云开发(CloudBase),主要是看中了云开发的 Serverless 架构,省去了运维的麻烦,可以专注在业务逻辑上。 核心技术实现 1. OCR 识别 + LLM 解析的组合方案 最开始的想法是直接用 OCR 识别彩票上的号码,但实际遇到了几个问题: 彩票样式五花八门,双色球、大乐透、福彩 3D 等格式都不一样 光学识别出文字后,还要定位哪些是投注号码、哪些是期号、站点编号等 号码排列有时是横向有时是纵向,传统规则解析很难覆盖所有情况 后来采用了 OCR + LLM 结构化提取 的方案: // 1. 先用腾讯云 OCR 识别文字 const ocrResult = await customOCRService.detectFromDataURL(imageData); // 2. 将 OCR 结果交给智谱 AI 的 LLM 进行结构化解析 const lotteryInfo = await parseLotteryByZhipuLLM(ocrResult.ocr_result); // 3. 获取开奖数据进行比对…