跳转至

02 补完:初始形态

补完状态下机体会失去自己的力场,彻底成为预测下一个词的机器

适用场景

  • 长文续写、邮件/报告/方案一键补全,避免多轮往返。
  • 代码片段/注释补全,或“说一句,出一段”的快速草稿。
  • 希望和多轮对话隔离,单次生成不带历史记忆。

补完模式的工作方式(基于 xNet 与 widget_toolflow 实现)

  • 输出区全文会直接作为 prompt/v1/completions,不带系统提示、历史消息与工具描述;采样参数沿用设置页的温度/top_p/repeat/n_predict,链接模式会把 n_predict 透传为 max_completion_tokens
  • 不触发工具链:<tool_call> 解析在补完模式被跳过,如需工具请改用“对话”模式。
  • 单轮完成后自动重置:收到回复即 normal_finish_pushover(),随后 on_reset_clicked() 清理上下文与记录条;输出区文本会保留、输入框重新置灰,便于在原文上继续修改后再补完。
  • 停用词有效:在“约定”里设置的额外 stopwords 会写入请求的 stop 数组,可用于控制收尾。

开始前

  • 已按《对话》页跑通装载(本地或链接模式均可)。
  • 打开 “设置”,选择“补完模式”单选,点击确定。此时输入框变为只读、占位提示为“Please modify any text above”,发送按钮文案变为“complete”,输出区获得焦点。
  • 建议参数:温度 0.3~0.6(降低发散),n_predict 设定希望的输出长度;需要强制收尾可在“约定”添加停用词。

操作步骤(照做即可)

1) 进入补完模式:如上切换后,确认状态灯为“正常”,按钮均可点。 2) 准备文本:在输出区粘贴/编辑待续写的正文。若需提纲,可先在“对话”模式生成,再复制到这里;补完模式不会发送图片/音频/文档。 3) 控制长度与停点:在“设置”里调整 n_predict;若要在特定标记处停下,可在文本末尾加入提示或将停用词写入“约定”。 4) 发送与收尾:按 Ctrl+Enter 或点击“complete”。流式展示完毕后会自动重置上下文和记录条,但生成内容仍保留在输出区,方便直接修改后再次补完。 5) 保存/复用:满意后复制到目标文档;若想继续讨论,可切回“对话”模式并将结果粘贴为新消息。

小技巧

  • 代码补全:在开头写清语言/文件名/函数名,模型更容易保持风格;需要续写多段时在末尾标注“到此结束”防止越界。
  • 控制篇幅:n_predict 太小会截断,太大容易跑题;可以结合停用词或在文末加“请在 200 字内收尾”。
  • 先总结再补完:长输入可先用“对话”模式让模型总结要点,再把摘要贴回补完,提高聚焦度。

常见问题

  • 输出过短:提升 n_predict,或在提示中要求“生成完整段落/完整函数”。
  • 输出跑题:在正文开头补充“上下文/目标”,或先用“对话”模式做摘要再补完。
  • 想多轮对话:补完模式每轮都会重置上下文且不存历史,需切回“对话”保持记忆。
  • 没看到回复:确认仍在“正常”状态灯;补完模式不展示工具错误,如无流式输出多为端点/参数问题,可先按《对话》页的排查步骤检查网络与模型。

补完页面示意

返回总览 · 上一页:对话 · 下一页:语音交互