PaddleNLP v2.1 提供工业界主流的解码加速支持 , 包括经典的 Beam Search , 以及多个 Sampling-based 的解码方式:如 Diverse Sibling Search[6]、T2T 版本的 Beam Search 实现 [7]、Top-k/Top-p Sampling 等 。 丰富的加速策略可以满足对话、翻译等工业场景的实际应用 , 同时 PaddleNLP 的加速实现也在百度内部经过了大规模互联网业务的真实考验 。
文章图片
表 1:PaddleNLP 2.1 支持加速的模型结构与解码策略
更多 PaddleNLP 加速使用文档可以参考:
https://github.com/PaddlePaddle/PaddleNLP/blob/develop/docs/advanced_guide/fastertransformer.rst
别的不需要多说了 , 大家访问 GitHub 点过 star 之后自己体验吧:
https://github.com/PaddlePaddle/PaddleNLP
直播预告 除了重磅发版以外呢 , 我们还为大家精心准备了配套课程 , 在 10 月 13-15 日 , 连续三天 PaddleNLP 技术精讲课程 , 百度飞桨的明星讲师们历时一个月呕心沥血打磨的三日课 , 小伙伴们速度报名 , 快速 get PaddleNLP 最新技能点!
直播预告报名链接:https://paddleqiyeban.wjx.cn/vj/QG4uBYa.aspx?udsid=126583
[1] Entailment as Few-Shot Learner
(https://arxiv.org/pdf/2104.14690.pdf)
[2] Exploiting Cloze Questions for Few Shot Text Classification and Natural Language Inference
(https://arxiv.org/pdf/2001.07676.pdf)
[3] GPT Understands, Too
【模型|开箱即用的产业级NLP工具库,性能加速最高可达28倍】(https://arxiv.org/pdf/2103.10385.pdf)
[4]FewCLUE: A Chinese Few-shot Learning Evaluation Benchmark
(https://arxiv.org/pdf/2107.07498.pdf)
[5] https://github.com/NVIDIA/FasterTransformer
[6] A Simple, Fast Diverse Decoding Algorithm for Neural Generation
(https://arxiv.org/pdf/1611.08562.pdf)
[7] Google’s Neural Machine Translation System: Bridging the Gap between Human and Machine Translation (https://arxiv.org/pdf/1609.08144.pdf)
推荐阅读
- 雷军|和雷军一起开箱,领取小米12「专属指南」
- 最新消息|被骂“从未见过如此厚颜无耻之书” 中华书局回应称即日下架
- 骁龙|骁龙8旗舰驯龙大战一触即发,“大师”和“高手”谁更厉害?
- 视点·观察|互联网人身险新规过渡期即将结束 17家险企明年起暂别该业务
- 画质|AMD RSR 分辨率缩放技术曝光:基于 FSR,无需游戏适配即可使用
- 电子商务|无需扫码、碰一碰即可完成支付 数字人民币硬钱包充电桩项目启动!
- 模型|2022前展望大模型的未来,周志华、唐杰、杨红霞这些大咖怎么看?
- 视频|中国移动联盟优品店炸裂来袭!惊喜一触即发!戳视频一探究竟!
- 花湖|亚洲第一个专业货运机场!花湖机场即将启航
- 产品|青岛有“礼”正式揭秘:华为首家青岛旗舰店开业在即