HuggingChat 是由人工智能公司 Hugging Face 推出的一款开源聊天机器人。
HuggingChat 本质上是一个用户界面,其背后由非营利组织 LAION 开发的对话模型 OpenAssistant/OASST-SFT-6-Llama-30b 作支撑。OASST-SFT-6-Llama-30b 是 Open Assistant 团队基于 Meta 的 Llama-30b 微调的语言模型,拥有300亿参数。
HuggingChat 可以完成一些复杂的生成任务,例如编写代码、起草电子邮件、创作歌词等,其功能与 ChatGPT 类似。它的特点包括开源且免费使用,还提供了网络搜索功能,能让搜索出的答案更准确。
HuggingChat 目前支持多种开源模型,如:
- cohereforai/c4ai-command-r-plus:Cohere 的最新大型语言模型,并且是首个在 chatbotarena 中击败 GPT-4 的开放权重模型,在对话系统和自然语言处理方面具有强大的性能。
- huggingfaceh4/zephyr-orpo-141b-a35b-v0.1:基于 Mistral8x22b 模型微调的版本,使用了 orpo 训练,可能有助于模型更好地理解和生成文本。
- mistralai/mixtral-8x7b-instruct-v0.1:Mistralai 最新的混合专家(MOE)模型,拥有 8x7b 的规模,在大多数基准测试中超越了 Llama270b 模型。
- google/gemma-1.1-7b-it:Gemma 系列的最新轻量级模型,使用 rlhf 方法训练,可能使模型在特定任务上表现更好。
- nousresearch/nous-hermes-2-mixtral-8x7b-dpo:基于 mixtral8x7bmoellm 训练,使用了 dpo 训练。
- mistralai/mistral-7b-instruct-v0.2:Apache2.0 许可模型,在基准测试中超越了 Llama213b 模型,Apache2.0 许可意味着该模型使用灵活,可自由用于各种用途。
HuggingChat 还在不断更新和改进中,例如近期给网页搜索功能做了升级,支持检索增强生成(RAG),可从多个网页中提取相关信息。
不过,需要注意的是,与所有文本生成模型一样,HuggingChat 生成的回答是随机的,可能会出现错误或者虚假信息。在使用时,需要对其生成的内容进行适当的评估和验证。