• [分享创造] 产品上线半月的故障、挑战与优化之路

    ·

    博客原文: 基于贝叶斯算法的 Telegram 广告拦截机器人(二):上线半月的故障、挑战与优化之路 1 引言 半个月前,我发布了一个基于贝叶斯算法的 Telegram 广告拦截机器人 @BayesSpamSniperBot (https://t.me/BayesSpamSniperBot) 项目地址:https://github.com/ramsayleung/bayes_spam_sniper 系列文章: 基于贝叶斯算法的 Telegram 广告拦截机器人(一):从问题到产品 尽管项目代码开源,但我始终以产品思维运营它。上线半个月以来,经历了故障、用户反馈与持续优化,现将这段经历分享出来。 2 上线即故障 没想到我的产品的第一个线上故障来得这么快,发布的时候直接不可用,把正常消息都给删了,用户在各种途径都向我反馈: 故障的原因是我当时一直在收集垃圾广告的数据,太专注于垃圾广告数据,而忽略了收集的正常数据, 导致垃圾广告数据过多,消息都被认为是垃圾广告,被误删了。 通过补充大量正常消息数据,重新平衡训练集,模型逐渐恢复正常识别能力。 3 挑战 3.1 邮件与即时消息的差异 我在《基于贝叶斯算法的 Telegram 广告拦截机器人(一):从问题到产品》里面提到过: 常见的 Telegram 广告机器人是大多是基于关键字的,通过匹配关键字进行文本拦截,非常容易被发垃圾广告的人绕过。 这不禁让我想起了保罗.格雷厄姆在《黑客与画家》一书在 2002 年介绍的情况: 当时电子邮件兴起,也有非常多的垃圾邮件,常见的垃圾广告拦截方式是关键字匹配+邮件地址黑名单,但是既低效也容易被绕过。 保罗.格雷厄姆就创造性地使用贝叶斯算法(Bayes Theorem)实现了一个广告拦截器, 效果竟然出奇地好。 但产品上线之后,我发现聊天软件消息和 Email 虽然都是文字,还是有很大差别的: Email 大多时候都是长文的,内容较长,并且大多情况,一封邮件上下文本身也很完整,就有较多的内容,较高的准确度来判断是否是广告。 而 Telegram, 微信这类的即时聊天软件,聊天消息大多都不长,可能把内容分成多条消息来发,就没有完整的上下文,比如: 换 U 找我 单条消息很较难准确判断是否是广告,所以对即时消息做广告拦截本身就更难, 「短文本+无上下文」是 NLP 中的经典难题,也是本项目最大的技术挑战。…

    Read More

  • [分享发现] 移动 无忧行 貌似上线了 eSIM

    ·

    无忧行官网 https://www.jegotrip.cn/m/mobileIndex.html 给出的 Android 版下载地址跳转到 Google Play 提示:找不到该内容。这样是不是被下架了,上次更新距今快满一年了,感觉被放弃了。 然后找出个同中国移动国际开发的包名类似,图标雷同的应用。https://play.google.com/store/apps/details?id=com.cmi.jego.global 7 月 18 号发布 1.0.0 版本。 功能介绍:全球 eSIM 、SIM 卡管理和中国旅游必备 但美区 Play 市场提示:此商品无法在您所在国家/地区购买或下载。 从 apkpure 上找到安装包(12+M 大小)下载安装后 xiaomi.eu 的 rom 打开闪退。 有能从 Play 市场下载安装打开的看看这到底是什么应用。

    Read More

  • [问与答] 本人开发了一个全局消息加解密 APP,有风险吗?

    ·

    项目地址: https://github.com/WJZ-P/NekoCrypt 实现方式是基于安卓的无障碍机制,对其他 APP 是非侵入式的,不会改其他 APP 代码。 并且实现了添加自定义 APP 功能。使用是无感的,正常按发送,软件自动会做加密后再发送出去。 感觉做这种加解密相关的,有喝茶风险,但是如果我 APP 内部不带任何 APP 信息(把内置的删掉),全靠用户自己添加,这样会有问题吗?这样的话就是用户个人行为,跟开发者没关系了。

    Read More

  • [职场话题] 应届生,有小型开源项目,但是写代码能力很差,感觉无缘开发岗

    ·

    2021 开始在澳洲读计算机科学本科,2024 年至今在读 it 专业的硕士。 刚上本科的时候写代码能力就很差,也没好好学,找个借口就是长年睡眠不好,白天极度疲劳根本没精力学习(运动损伤导致,困扰了八年,今年年初才大幅好转)。 22 年 chatgpt 爆火。那时候有个毕设:安卓 app 项目,是我第一次真真切切的投入到一个项目,但是全靠当时的 chatgpt 。 今年,正好上了一门分布式计算的课,学了一点 kotlin ,于是想把去年 vibe coding 写的一个简陋的 java+传统 view 的项目(自己用的)用 jetpack compose 重构一下,加点功能(虽然还是离不开 vibe coding ,但我用 llm 的时候每一步还是相对谨慎的,不希望把一个项目越写越屎。)然后感觉差不多了就发布到 F-droid ,被收录了,从五月份重构到现在有 90 多个 star ,真的非常开心了。有时间就会修修补补,根据 issues 里为数不多的用户提的问题耐心回应。 年底 12 月就要毕业了,所以这个时候不得不开始投国内秋招岗位了。投了几个移动端开发岗,笔试基本啥也不会,手撕也做不出来。之前 leetcode 简单题做了几十道吧,总共就做出来一两道,大部分时候题目都看不懂,不管中文还是英文。面试根据以往几次的经验也都是一问三不知,八股面经也看不进去。 去年也投过 java 后端。对此所做的努力在跟着教程敲了个苍穹外卖之后就无了。 感觉写安卓 app 的时候还是挺开心的,可能这种快乐源于“创造”,虽然对 ai 依赖很大。很喜欢 material design 。…

    Read More

  • [iPhone] iPhone 17 Air 国行版 eSIM 限制

    ·

    以下消息来自于抖音”丁香花”国行 eSIM 的要求非常严格, 数据必须储存在云上贵州(也就是说,账号必须得是国内的), 不开启 iCloud 就没有办法写号; 定位是先利用当地的基站进行大致定位, 然后再利用北斗进行精准定位(别想用虚拟定位绕开检测了)据说本来好像还有一套更严格的检测机制, 也就是国行的设备无法登录国外的 ID, 而且好像能限制使用地区(可以精确限制到市级地区), 只要离开地区范围就会导致 eSIM 失效

    Read More