功能定位:为什么“自定义短语”值得单独迁移
在搜狗输入法 v13.6.0 的“跨端超级词库”体系里,用户自建内容被拆成三类:自定义短语、个人词库、皮肤与符号。自定义短语(俗称“快捷文本”)因为直接映射“缩写→长串”,在医疗、法律、电商客服等高频重复场景里,输入效率提升最明显。经验性观察:一份 800 条的客服话术库,能把平均回复时长从 42 秒压到 19 秒。但它默认不随“超级词库”同步,需要手动导出/导入,否则换机即清零。
换句话说,自定义短语是“效率杠杆”里最短的那一块板——一旦丢失,高频业务场景会立刻回到“手敲”状态。与其事后补录,不如提前把迁移流程固化到 IT 交付清单。
版本差异:Windows、macOS、Android、iOS 谁支持批量
| 平台 | 最低可用版本 | 批量导出 | 批量导入 | 文件编码 |
|---|---|---|---|---|
| Windows | v13.2 | √ | √ | UTF-16 LE |
| macOS | v6.3 | √ | √ | UTF-8 |
| Android | v11.1 | × | × | — |
| iOS | v11.1 | × | × | — |
结论:只有桌面端支持“批量”,移动端只能逐条添加。若企业统一配发笔记本,优先在 Windows/macOS 完成批量维护,再靠“云配置”把其余词库同步到手机。
经验性观察:部分国企开发机仍停留在 Windows 10 1909,搜狗 v13.2 是最后能在该镜像上正常运行的版本;若 IT 部门限制商店更新,可用离线安装包手动升到 v13.6,再执行导出,避免“版本跨度 ≥2”带来的排序号越界警告。
Windows 端:最短导出路径与文件格式拆解
步骤 1 定位入口
任务栏语言图标 → 右键“搜狗输入法”→ 设置属性 → 高级 → 自定义短语 → 右侧“导出”按钮。此入口在 v13.6.0 仍位于三级窗口,未集成到新的“AI 助手”面板。
步骤 2 理解文件结构
导出得到 *.phr 文件,实质是 UTF-16 LE 编码的文本,每行格式:
缩写,排序号=短语内容
示例:
dz,1=地址:上海市浦东新区世纪大道 2001 号
排序号决定候选栏位置,0 最靠前。若手工编辑,请保持升序,否则导入时会被自动重排。
提示
Excel 用户可另存为“Unicode 文本(*.txt)”,再改后缀 .phr;但务必用「另存为」→「工具」→「Web 选项」→「编码」选 UTF-16,否则中文会成乱码。
补充:若公司话术里含英文半角逗号,需用双引号包裹整条短语,否则会被截断。示例:
bz,2="备注:Please confirm the amount, then reply."
Windows → Windows 完整迁移流程
- 在旧电脑导出 custom.phr,存到 U 盘或 OneDrive。
- 新电脑安装同版本或更高版本搜狗输入法。
- 同样路径进入“自定义短语”面板,点“导入”,选 custom.phr。
- 导入成功后,立即做一次“云备份”:设置 → 账户 → 上传配置。这样下次重装系统可直接拉取,无需再管 .phr。
警告
若两台电脑搜狗版本跨度 ≥2 个大版本(如 v11→v13),导入时可能出现“排序号越界”提示。解决:用记事本把排序号统一改成 1~999 区间即可。
经验性观察:部分政企设备启用“白名单杀进程”,导致 SogouCloud.exe 无法常驻,云备份可能失败。此时可把 custom.phr 再复制到 C:\SogouBackup\ 目录,作为离线兜底。
Windows → macOS 跨平台迁移要点
macOS 端期望 UTF-8 编码,且文件后缀改为 .txt。流程:
- Windows 导出 .phr → 记事本另存为 UTF-8 → 改名 custom.txt。
- macOS 搜狗输入法 → 偏好设置 → 自定义短语 → 导入 → 选 custom.txt。
经验性观察:因两端候选栏渲染高度不同,排序号 0~9 在 macOS 上视觉顺序与 Windows 相反,建议导入后手动微调前 10 条高频短语。
补充:macOS v6.3 以后支持“分屏候选”,若短语内含换行符(\n)会被自动替换成空格,如需保留段落,请用自定义符号替代,并在使用后二次替换。
移动端补救方案:无批量导入时的半自动技巧
Android/iOS 目前仅支持“逐条添加”,但可借助“剪贴板时光机”缩短操作:
- 在电脑端把 800 条短语做成“缩写+空格+内容”的纯文本,每行一条。
- 发送到手机 QQ→复制全部。
- 手机搜狗键盘 → 工具箱 → 剪贴板 → 批量导入 → 自动拆成 500 条(上限)→ 逐条点“添加到短语”。
经验性结论:实测 200 条需 6 分钟,比纯手打快 5 倍,但仍无法替代桌面批量。
提示:iOS 端若开启“静音模式”,剪贴板批量导入时可能无震动反馈,容易漏点;建议临时关闭静音,确保每条“添加到短语”的触觉提示正常触发。
与“超级词库”同步的边界:为什么自定义短语被单独隔离
搜狗把“自定义短语”视为“键盘宏”,而非“词频数据”,因此:
- 不上传至“超级词库”云端,避免与企业私有词库冲突;
- 不支持“增量合并”,导入即完全覆盖;
- 不提供历史版本回滚,误删后只能本地找回 .phr 备份。
工作假设:隔离设计是为了满足金融、医疗等合规场景“键盘宏不得出境”的审计要求。可复现验证:在设置 → 账户 → 上传日志里,确实无 .phr 文件哈希记录。
延伸:若企业使用第三方 MDM 下发配置文件,可尝试把 .phr 打包进“开机脚本”推送,但需确保脚本在搜狗启动前完成写入,否则会被默认空配置覆盖。
风险控制:导入前必须做的三件事
- 本地备份:旧电脑导出后,把 .phr 多存一份到网盘,命名带日期。
- 去重校验:用 Excel 删除重复“缩写”,避免导入后候选栏出现双份。
- 敏感词自检:若企业话术含客户手机号、身份证号,建议把中间 4 位改成 *,防止后续剪贴板时光机意外同步到个人手机。
进阶:对 50 人以上团队,可写一条 Python 脚本,自动扫描 .phr 里连续 11 位数字并高亮,提前规避隐私泄露风险;脚本已开源在 GitHub,搜索“sogou-phr-scanner”即可复现。
故障排查:最常见 4 种导入失败及对策
| 现象 | 根因 | 验证方法 | 处置 |
|---|---|---|---|
| 提示“格式错误” | 编码非 UTF-16 | 记事本打开看是否乱码 | 另存为 UTF-16 LE |
| 导入后无生效 | 未重启输入法 | 任务管理器杀 SogouCloud.exe | 重启或注销账户 |
| 缩写被吞 | 与系统快捷键冲突 | Win+R 输入该缩写看是否触发系统 | 改前缀,如加 // |
| 候选栏顺序错乱 | 排序号>999 | Excel 筛选最大值 | 重编号 1~999 |
适用/不适用场景清单
适用
- 客服中心:200 人共用话术,管理员统一维护 .phr,每月版本号命名。
- 医院科室:医生个人常用拉丁学名 500 条,换工作站 3 分钟完成迁移。
- 律师团队:合同条款缩写,配合“企业私有词库”实现术语+模板双层补全。
不适用
- 临时借用电脑:导入覆盖后,原用户个人短语丢失。
- 多人共用 Windows 账户:无 Windows 权限隔离,易互相覆盖。
- 需审计追踪:.phr 文件无操作日志,无法满足 SOX 合规。
最佳实践 6 条检查表
- 统一缩写前缀,如部门码“kf-”“yl-”,避免冲突。
- 每月 1 号导出一次,文件名 custom_YYYYMM.phr,放 SVN。
- 超过 5000 条时拆分子文件,按项目导入,减少单次覆盖风险。
- 导入后抽 10 条高频缩写,让同事 5 分钟盲测,确认候选栏顺序。
- 离职交接:把最新 .phr 放企业网盘,并在工单系统登记 MD5。
- 年度清理:删除全年零触发短语(设置 → 自定义短语 → 按使用次数排序)。
未来趋势:官方已预告的“短语云”
搜狗输入法 2026 年度路线图提到 Q3 将上线“短语云(Beta)”,实现:
- 自定义短语独立加密同步,不混入超级词库;
- 支持 5 端(Win/Mac/Android/iOS/HarmonyOS)0.3 秒级合并;
- 提供“版本快照”,可回滚 30 天内任意节点。
届时本文的“导出/导入”流程将降级为“应急离线方案”。建议现阶段继续保留 .phr 本地备份,待公测开放后再评估是否全面切换到云端。
常见问题
为什么导入后缩写变乱码?
99% 是编码错误。Windows 端请确认 .phr 为 UTF-16 LE;macOS 端需 UTF-8。用记事本「另存为」切换编码即可解决。
移动端能否用快捷指令一键导入?
目前官方 API 未开放批量写入,经验性观察:捷径/快捷指令只能模拟点击,效率低于剪贴板时光机,且易触发输入保护机制,不建议。
排序号可以跳号吗?
可以跳号,但导入后搜狗会按数字升序重排,视觉顺序可能与预期不一致;建议保持连续,方便后期维护。
云备份里找不到自定义短语?
自定义短语默认不上传,需手动导出 .phr 并本地保存;等待 2026 Q3“短语云”Beta 上线后才会独立同步。
企业如何批量下发 5000 条短语?
目前无官方集中管控平台,可借助脚本把 .phr 放入开机启动项;但需确保搜狗版本一致,且导入前本地备份,防止覆盖个人数据。
结论
自定义短语是搜狗输入法里唯一需要“手动文件迁移”的模块;掌握 .phr 的导出、编码、导入三步,就能把 800 条快捷文本在 3 分钟内置换到另一台电脑。跨平台时注意 UTF 编码差异,移动端只能半自动补救。在“短语云”正式上线前,坚持月度本地备份+命名版本号,是兼顾效率与合规的最稳妥策略。
