🤗 Datasets 使用小贴士: 探索解决数据集无法下载的问题

2023-07-18
阅读 1 分钟
765
Hugging Face Hub 是强大的机器学习的数据源。相信大家在国内用 Hugging Face Datasets 都遇到过下载的问题。譬如:
封面图

🤗Hugging Face 87个 AI 游戏可以在线玩啦

2023-07-18
阅读 1 分钟
303
7月9日的开源游戏挑战赛有超过来自全球 1000 多名开发者参加 🔥一共收录了 87 个游戏 🎮目前已经进入投票期 🗳视频中的:猜名画 🖼️ 用了之前推荐的 LEDITS目前得分很高呢 👀来试试看你能猜对几幅名画?
封面图

Hugging News #0717: 开源大模型榜单更新、音频 Transformers 课程完成发布!

2023-07-17
阅读 3 分钟
553
每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,我们将其称之为「Hugging News」。本期 Hugging News 有哪些有趣的消息,快来看看吧! 🎉 😍
封面图

基于 NNCF 和 🤗 Optimum 面向 Intel CPU 对 Stable Diffusion 优化

2023-07-12
阅读 5 分钟
629
基于隐空间的扩散模型 (Latent Diffusion Model),是解决文本到图片生成问题上的颠覆者。Stable Diffusion 是最著名的一例,广泛应用在商业和工业。Stable Diffusion 的想法简单且有效: 从噪声向量开始,多次去噪,以使之在隐空间里逼近图片的表示。
封面图

Hugging News #0710: 体验 MusicGen、Diffusers 库发布一周年、我们的内容政策更新

2023-07-12
阅读 4 分钟
371
每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,我们将其称之为「Hugging News」。本期 Hugging News 有哪些有趣的消息,快来看看吧! 🎉😍
封面图

道德与社会问题简报 #4: 文生图模型中的偏见

2023-07-07
阅读 5 分钟
939
文本到图像 (TTI) 生成 现在非常流行,成千上万的 TTI 模型被上传到 Hugging Face Hub。每种模态都可能受到不同来源的偏见影响,这就引出了一个问题: 我们如何发现这些模型中的偏见?在当前的博客文章中,我们分享了我们对 TTI 系统中偏见来源的看法以及解决它们的工具和潜在解决方案,展示了我们自己的项目和来自更广泛...
封面图

基础大模型能像人类一样标注数据吗?

2023-07-06
阅读 12 分钟
892
自从 ChatGPT 出现以来,我们见证了大语言模型 (LLM) 领域前所未有的发展,尤其是对话类模型,经过微调以后可以根据给出的提示语 (prompt) 来完成相关要求和命令。然而,直到如今我们也无法对比这些大模型的性能,因为缺乏一个统一的基准,难以严谨地去测试它们各自的性能。评测我们发给它们的指令以及对话模型本身,从...

线上活动 | AI 头像变装秀

2023-07-06
阅读 1 分钟
1k
​宝子们,你的头像多久没换了?👀送你一个锦囊,让你拥有既独一无二,又千变万化的专属 AI 头像 🤩🤗 Hugging Face 将在 7 月 5 日 发起:AI 头像变装秀 🔥❗️❗️❗️游戏规则❗️❗️❗️我们将分享一段 Stable Diffusion 的 Notebook 代码 🖥️[链接]将指导大家用这段代码生成自己喜欢的头像 💗✨ 所有小红书的用户都可以加入✨ 生成头像...
封面图

据说,Transformer 不能有效地进行时间序列预测?

2023-07-05
阅读 23 分钟
798
几个月前,我们介绍了 Informer 这个模型,相关论文 (Zhou, Haoyi, et al., 2021) 是一篇获得了 AAAI 2021 最佳论文奖的时间序列论文。我们也展示了一个使用 Informer 进行多变量概率预测的例子。在本文中,我们讨论以下问题: Transformer 模型对时间序列预测真的有效吗?我们给出的答案是,它们真的有效。
封面图

Hugging News #0703: 在浏览器中运行 Whisper 模型、WAIC 分论坛活动邀请报名

2023-07-03
阅读 3 分钟
810
每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,我们将其称之为「Hugging News」,本期 Hugging News 有哪些有趣的消息,快来看看吧!
封面图

微调用于多语言 ASR 的 MMS 适配器模型

2023-06-29
阅读 23 分钟
1.1k
Wav2Vec2 是自动语音识别 (ASR) 的预训练模型,由 Alexei Baevski、Michael Auli 和 Alex Conneau 于 2020 年 9 月 发布。其在最流行的 ASR 英语数据集之一 LibriSpeech 上展示了 Wav2Vec2 的强大性能后不久, Facebook AI 就推出了 Wav2Vec2 的两个多语言版本,称为 XLSR 和 XLM-R,能够识别多达 128 种语言的语音。XLS...

使用 Transformers 为多语种语音识别任务微调 Whisper 模型

2023-06-27
阅读 17 分钟
1.3k
本文提供了一个使用 Hugging Face 🤗 Transformers 在任意多语种语音识别 (ASR) 数据集上微调 Whisper 的分步指南。同时,我们还深入解释了 Whisper 模型、Common Voice 数据集以及微调等理论知识,并提供了数据准备和微调的相关代码。如果你想要一个全部是代码,仅有少量解释的 Notebook,可以参阅这个 Google Colab。
封面图

Hugging News #0626: 音频课程更新、在线体验 baichuan-7B 模型、ChatGLM2-6B 重磅发

2023-06-26
阅读 3 分钟
628
每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,我们将其称之为「Hugging News」,本期 Hugging News 有哪些有趣的消息,快来看看吧!
封面图

Hugging Face 入选 Time《时代周刊》2023 全球前 100 最具影响力的公司

2023-06-26
阅读 1 分钟
600
🚀🥳🎊 喜报 🎊🥳🚀Hugging Face 入选 Time《时代周刊》2023 全球前 100 最具影响力的公司 🎉继续为梦想努力 💪 继续为开源贡献 🔥榜单链接:[链接]

使用 InstructPix2Pix 对 Stable Diffusion 进行指令微调

2023-06-20
阅读 7 分钟
598
本文主要探讨如何使用指令微调的方法教会 Stable Diffusion 按照指令 PS 图像。这样,我们 Stable Diffusion 就能听得懂人话,并根据要求对输入图像进行相应操作,如: 将输入的自然图像卡通化 。
封面图

全球开源 AI 游戏开发挑战赛,只等你来!

2023-06-20
阅读 2 分钟
710
我们在之前的文章中 预告过 (*划重点,IP 属地法国):7 月初,我们将举办一次与 AI 游戏相关的黑客松活动,这是有史以来的首次开源游戏开发挑战赛,借助人工智能工具释放你的创造力,一起打破游戏开发的边界。
封面图

Hugging News #0616: 有几项非常重要的合作快来围观、最新中文演讲视频回放发布!

2023-06-17
阅读 2 分钟
926
每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,我们将其称之为「Hugging News」,本期 Hugging News 有哪些有趣的消息,快来看看吧!
封面图

Hugging Face 音频 AI 派对直播回放(上)

2023-06-16
阅读 1 分钟
977
[链接]为了庆祝 Hugging Face 新开设的免费开源 Audio Transformers 课程的启动,我们组织了一场不容错过的网络直播活动!这是直播回放的第一部分,错过直播的 🤗 宝子们别错过回放噢~

Falcon 登陆 Hugging Face 生态

2023-06-16
阅读 9 分钟
1.1k
Falcon 是由位于阿布扎比的 技术创新研究院 (Technology Innovation Institute,TII) 创建的一系列的新语言模型,其基于 Apache 2.0 许可发布。 值得注意的是,Falcon-40B 是首个“真正开放”的模型,其能力可与当前许多闭源模型相媲美。这对从业者、爱好者和行业来说都是个好消息,因为“真开源”使大家可以毫无顾忌地基于...
封面图

如何在 Unity 游戏中集成 AI 语音识别?

2023-06-16
阅读 8 分钟
1.2k
语音识别是一项将语音转换为文本的技术,想象一下它如何在游戏中发挥作用?发出命令操纵控制面板或者游戏角色、直接与 NPC 对话、提升交互性等等,都有可能。本文将介绍如何使用 Hugging Face Unity API 在 Unity 游戏中集成 SOTA 语音识别功能。
封面图

Hugging News #0609: 最新代码生成模型 StarCoder+ 和 StarChat Beta 重磅发布!

2023-06-11
阅读 2 分钟
1.2k
每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,我们将其称之为「Hugging News」,本期 Hugging News 有哪些有趣的消息,快来看看吧!
封面图

如何安装和使用 Hugging Face Unity API

2023-06-11
阅读 2 分钟
1.5k
Hugging Face Unity API 提供了一个简单易用的接口,允许开发者在自己的 Unity 项目中方便地访问和使用 Hugging Face AI 模型,已集成到 Hugging Face Inference API 中。本文将详细介绍 API 的安装步骤和使用方法。
封面图

在Transformers 中使用约束波束搜索引导文本生成

2023-06-11
阅读 10 分钟
1.5k
与普通的波束搜索不同,约束 波束搜索允许我们控制所生成的文本。这很有用,因为有时我们确切地知道输出中需要包含什么。例如,在机器翻译任务中,我们可能通过查字典已经知道哪些词必须包含在最终的译文中; 而在某些特定的场合中,虽然某几个词对于语言模型而言差不多,但对最终用户而言可能却相差很大。这两种情况都可...
封面图

解码器 | 基于 Transformers 的编码器-解码器模型

2023-06-07
阅读 13 分钟
546
基于 transformer 的编码器-解码器模型是 表征学习 和 模型架构 这两个领域多年研究成果的结晶。本文简要介绍了神经编码器-解码器模型的历史,更多背景知识,建议读者阅读由 Sebastion Ruder 撰写的这篇精彩 博文。此外,建议读者对 自注意力 (self-attention) 架构 有一个基本了解,可以阅读 Jay Alammar 的 这篇博文 ...
封面图

编码器 | 基于 Transformers 的编码器-解码器模型

2023-06-06
阅读 7 分钟
590
基于 transformer 的编码器-解码器模型是 表征学习 和 模型架构 这两个领域多年研究成果的结晶。本文简要介绍了神经编码器-解码器模型的历史,更多背景知识,建议读者阅读由 Sebastion Ruder 撰写的这篇精彩 博文。此外,建议读者对 自注意力 (self-attention) 架构 有一个基本了解,可以阅读 Jay Alammar 的 这篇博文 ...
封面图

Hugging News #0602: Transformers Agents 介绍、大语言模型排行榜发布!

2023-06-03
阅读 2 分钟
1.2k
每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,我们将其称之为「Hugging News」,本期 Hugging News 有哪些有趣的消息,快来看看吧!
封面图

编码器-解码器 | 基于 Transformers 的编码器-解码器模型

2023-06-01
阅读 6 分钟
1.1k
基于 transformer 的编码器-解码器模型是 表征学习 和 模型架构 这两个领域多年研究成果的结晶。本文简要介绍了神经编码器-解码器模型的历史,更多背景知识,建议读者阅读由 Sebastion Ruder 撰写的这篇精彩 博文。此外,建议读者对 自注意力 (self-attention) 架构 有一个基本了解,可以阅读 Jay Alammar 的 这篇博文 ...
封面图

背景 | 基于 Transformers 的编码器-解码器模型

2023-05-31
阅读 8 分钟
822
Vaswani 等人在其名作 Attention is all you need 中首创了 基于 transformer 的编码器-解码器模型,如今已成为自然语言处理 (natural language processing,NLP) 领域编码器-解码器架构的 事实标准 。
封面图

RWKV – transformer 与 RNN 的强强联合

2023-05-31
阅读 7 分钟
625
在 NLP (Natural Language Processing, 自然语言处理) 领域,ChatGPT 和其他的聊天机器人应用引起了极大的关注。每个社区为构建自己的应用,也都在持续地寻求强大、可靠的开源模型。自 Vaswani 等人于 2017 年首次提出 Attention Is All You Need 之后,基于 transformer 的强大的模型一直在不断地涌现,它们在 NLP 相关...
封面图

如何使用 Megatron-LM 训练语言模型

2023-05-29
阅读 6 分钟
989
在 PyTorch 中训练大语言模型不仅仅是写一个训练循环这么简单。我们通常需要将模型分布在多个设备上,并使用许多优化技术以实现稳定高效的训练。Hugging Face 🤗 Accelerate 的创建是为了支持跨 GPU 和 TPU 的分布式训练,并使其能够非常容易的集成到训练代码中。🤗 Transformers 还支持使用 Trainer API 来训练,其在 PyT...
封面图