issue/155: 服务端支持repetition_penalty by Ceng23333 · Pull Request #164 · InfiniTensor/InfiniLM

Ceng23333 · 2025-12-25T06:37:56Z

Unique Token 跟踪 (scripts/infer_task.py)
- 添加 _unique_generated_tokens 集合来跟踪唯一 token ID
- 修复：使用提示词 token 初始化（而非空集），以便提示词 token 也被惩罚
- 在 next() 生成新 token 时增量更新
- get_unique_previous_tokens() 返回排序的唯一 token 数组
批处理层 (scripts/jiuge.py)
- JiugeBatchedTask 从所有任务中收集唯一 token
- 为 C++ API 创建扁平数组和指针数组
- 高效处理每个请求的唯一 token 数组
C++ 接口更新
- 更新 inferBatchJiuge() 和 inferBatch() 以接受 previous_tokens_per_req 和 previous_tokens_len_per_req
- 更新 InferRequest 结构体以包含唯一 token 字段
- 更新 inferDeviceBatch() 和 inferDeviceBatchPaged() 以传递唯一 token
- 更新 InferenceContext::randomSample() 以接受并转发唯一 token
Python 绑定 (scripts/libinfinicore_infer/jiuge.py)
- 更新 inferBatchJiuge 参数类型以包含唯一 token 数组
- 更新 infer_batch() 方法签名
API 服务器 (scripts/launch_server.py)
- 添加 --port 和 --host 参数用于服务器配置
- 添加 OpenAI 兼容的 /models 端点
- 支持 chat_template_kwargs 透传

Signed-off-by: Ceng23333 <441651826@qq.com>

Ceng23333 added 2 commits December 25, 2025 09:42

服务端支持repetition_penalty

92545b5

Signed-off-by: Ceng23333 <441651826@qq.com>

fix scaling

85077bd

Signed-off-by: Ceng23333 <441651826@qq.com>

Ceng23333 requested a review from a team January 4, 2026 07:38

Ceng23333 added 10 commits January 5, 2026 11:29

support longrope fractor

9e26503

Signed-off-by: Ceng23333 <441651826@qq.com>

add timeout checker

9a37b38

Signed-off-by: Ceng23333 <441651826@qq.com>

fix streaming exception throwing

3d39ebc

Signed-off-by: Ceng23333 <441651826@qq.com>

update /models

e89073d

Signed-off-by: Ceng23333 <441651826@qq.com>

fix format of response

f52dd59

Signed-off-by: Ceng23333 <441651826@qq.com>

fix utf-8 decode issue

1f52f24

Signed-off-by: Ceng23333 <441651826@qq.com>

add max_cocurrency and replacement_char remove

a170282

Signed-off-by: Ceng23333 <441651826@qq.com>

optimize uffd checker

2d778e5

Signed-off-by: Ceng23333 <441651826@qq.com>

revert fix_replacement and apply vllm-like handling

7da9d5b

Signed-off-by: Ceng23333 <441651826@qq.com>

update ceval script

3a570a8

Signed-off-by: Ceng23333 <441651826@qq.com>

Provide feedback