Skip to content
View amzxyz's full-sized avatar

Block or report amzxyz

Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
amzxyz/README.md

Rime 万象拼音生态体系

一套为Rime输入法打造的​​全场景拼音解决方案​​,涵盖输入方案、带声调词库、预测模型、语法模型构建全流程。基于AI优化词库与32GB语料训练,实现智能整句输入与精���多音字处理。


仓库导航

1. RIME-LMDG - 语法模型

​技术亮点:​

  • 🧠 32GB多领域语料训练(新闻/法律/文学/社交等)
  • 📊 多级n-gram模型
  • 🔠 全汉字覆盖(CJK基本区→扩展G区)
  • 🎯 精准多音字处理(词+拼音双键统计)
  • 🛠️ 包含:
    • 模型构建教程
    • 每日更新的词库
    • 语法模型LTS版本
    • 预测模型预览版
    • 分词优化脚本
    • 语料清洗工具链
    • 拼音标注工具链(轻声、变调与幼儿园课本一致)
    • 辅助码标注工具链(万象拼音方案适用)

​适用场景​​:适用于任何编码形式的rime方案,但由于是基于拼音优化,故模型命中利用率应该是:带声调方案>传统拼音(含双拼、全拼)>形码整句>词组类方案(基本等同于词库扩展)


2. rime-wanxiang -万象拼音输入方案

​① wanxiang-base - 标准版双拼输入方案

​核心功能:​

  • ✨ 词库编码为声调全拼,可以通过这个基础库支持任何双拼或者全拼输入
  • ✨ 只支持单字状态下`引导反查定位候选字
  • ✨ 支持`引导的笔画或者部件组词反查
  • ✨ 支持输入编码或者注释里面的带声调编码显示
  • ✨ 支持新型造词用法,避免直接记忆用户词库污染
  • ✨ 智能语言模型支持整句预测
  • 更多详见仓库说明

​适合人群​​:传统输入法大厂输入法首次切换,全拼双拼用户,持有多平台终端的用户,如果万象成为你探索的起点那就从标准版开始吧,


② wanxiang-pro - 双拼辅助码增强版输入方案

​核心功能:​

  • ✨ 支持10种主流双拼(自然码/小鹤双拼/微软双拼/搜狗双拼/紫光双拼/智能ABC双拼/国标双拼/自然龙双拼(声调布局)等,用户也可以通过拼写运算获得任意双拼)
  • ✨ 提供6种辅助码体系(自然码/小鹤/墨���/汉心/五笔前2/仓颉/虎码首末)
  • ✨ 词库编码为声调全拼+辅助码,可以通过这个库支持任何全拼或者双拼+7种辅助码任意组合搭配
  • ✨ 智能语言模型支持整句预测
  • ✨ 其他配套同标准版本

​​​适合人群​​:具有双拼基础的用户,想要进阶辅助码辅助筛选的用户,持有多平台终端的用户


其他说明

该项目整体两个仓库是为了提升现有rime开源应用中输入体验而做出的努力,并非创造了一种输入布局,开发了一个软件,仅仅是rime生态中基础底座这一环,所以使用者应当清晰认识到,这里找不到教会你使用双拼、使用辅助码的教程,这些应当在你兴趣的作用下自己去调研、去学习, 其次对于rime的用法配置全网也有很多教程和示例,可能需要一定基础才能做到“识货”,本项目也不会在这个上面花过多时间,项目仓库里面写了使用方法。我将会将精力持续放在优化模型、优化词库。 [Star History Chart

Pinned Loading

  1. rime_wanxiang rime_wanxiang Public

    万象拼音:基于rime生态打造,全方位对标大厂体验,内置大语料与AI辅助炼制的向量词库和语法模型,全带调编码词库,让输入行云流水,开箱即用。更有PRO版带来辅助码创新体验,支持7种辅助码。集成超级注释、候选反查筛选、快符、手动排序、tips等特色扩展功能,让你保证大厂体验的同时,深度享受 Rime 超强自定义的便利。详见README。Q群:11033572 / 11631066

    Lua 3k 114

  2. RIME-LMDG RIME-LMDG Public

    fcitx5扩展词库/Rime全局带声调词库,最全声调标注工具链,Rime语法模型:LMDG - Language, Model, Dictionary, Grammar。

    Python 1.4k 37