5,901
社区成员




① NLP文本预处理(梯度已爆炸:[博客] [成就])
[质量分:97;难度等级:未知;新鲜技术:99]
摘要:分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。在英文的行文中,单词之间是以空格作为自然分界符的,而中文只是字、句和段能通过明显的分界符来简单划界,唯独词没有一个形式上的分界符。分词过程就是找到这样分界符的过程.
② Arch-Router-1.5B模型论文速读:使大型语言模型的路由与人类偏好保持一致(Open-source-AI:[博客] [成就])
[质量分:91;难度等级:未知;新鲜技术:99]
摘要:论文提出一个偏好对齐路由框架,允许用户将人类偏好编码为显式路由策略,并将策略与模型选择解耦,从而实现更透明、灵活的路由决策。二是路由有效性受用户模型选择限制,若用户将不合适模型分配给路由策略,即使路由准确也可能导致次优结果。