这个信奥赛初赛的备考神器,又有Yi点点加强

为了这篇能让更多家长看到,我起了这么一个奇葩的标题,我也是拼了。前段时间刚考完GESP,群里的家长一遍在兴奋地分享成绩,同时又催我赶快把6,7级的题目也用AI转出来。可我心里还有个更大的问题,这个叫信奥智题助手的软件,还不完美支持导入信奥赛的题[汗]如果您只关注重点,那么这篇接下来不用看了,去下载,然后切到测试频道。现在可以相对完美(因为还需要人工校对)地导入CSP初赛的题目了,试卷答题可以用键盘操作,再也不用麻烦地点开点去了。这个功能过几天会发布在稳定渠道。接下来继续我的心得,为什么pdf转换这么麻烦。一张csp/j的试卷往往有10,11页,最讨厌的是读程序题经常跨页,在过去,多模态模型要么是窗口不够大,要么是大窗口容易出错,要么就是最大输出不够,所以我采用的做法是一张图一张图转然后合并。但是如果遇到跨页的程序题,模型经常会自作聪明地补全被页面截断的代码。出错频率太大,人工校对噩梦。所以我认为是不可用的。我之前测试过国产模型的ocr能力,得出字节目前最强的结果。最近就用豆包1.5 vision pro的能力重构了处理。它支持一次同时转最多25张图,也支持16k输出。所以csp试卷就完美覆盖了。csp试卷比较蛋疼,它的结构特别复杂,一道读程序题大题消下面有几道小题,每道小题共享一段程序加文字,小题可以有选择和判断,如果让llm输出一个模型的json schema,这应该是个什么数据结构?我换了一个思路,输出什么json啊,让llm生成toml才是复杂结构的最优方案,于是现在终于可以非常流畅,极高成功率地转csp试卷了。不过,这还是要感谢模型能力的提升。另外最近火山引擎有每日送token的活动,我把账号改为企业认证后,每天可以得到单模型500万token,所以最近的测试和研究一点成本都没,这个功能要谢谢字节了。如果要用字节的多模态来做试卷的转换,我的推荐在图里,1.6和1.5 vision pro还有一个kimi k2 的模型我也大量使用在了各种流程里,我发现用它来做文本到toml转换效果是最好的,几乎都不用校对了,出现的问题都影响极小唠叨一堆,能看到这里的,应该都是对AI开发感兴趣的,希望我的心得对你们有帮助.也感谢群里家长的支持,我会继续努力更新感兴趣,想要提建议,不会用的家长,请来下方群里#信息学奥赛 #Gesp #ocr #cspj #少儿编程