Transformer-Attention优化：FlashAttention（让语言模型拥有更长的上下文）

小鱼儿 2023-10-13 13:32 36阅读 0赞

发表评论取消回复

表情：

评论列表（有 0 条评论，36人围观）

还没有评论，来说两句吧...

相关阅读

相关如何让AI拥有情感

人工智能无法真正拥有情感，因为它们是由计算机程序和数据构建的，无法感受和体验情感。但是，人工智能可以被设计成模拟人类的情感表达，并通过自然语言处理、机器学习等技术来模拟人类的情

深藏阁楼爱情的钟/ 2024年03月27日 17:53/ 0 赞/ 97 阅读

相关模板优化让程序更灵活更通用

这里写目录标题类模板类模板和模板类非类型模板参数类模板 C++中的类模板（Class Template）允许创建一个通用的类，其中的数据

傷城~/ 2024年02月05日 13:57/ 0 赞/ 55 阅读

相关 LLM：ChatGLM2-6B【更长的上下文（FlashAttention）】【更高效的推理（Multi-Query Attention）】

介绍 ChatGLM2\-6B 是开源中英双语对话模型 [ChatGLM-6B][] 的第二代版本，在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上，Cha

落日映苍穹つ/ 2023年10月14日 23:16/ 0 赞/ 35 阅读

相关 Transformer-Attention优化：FlashAttention（让语言模型拥有更长的上下文）

> 论文地址：[FlashAttention: Fast and Memory-Efficient Exact Attention with IO-Awareness][Fla

小鱼儿/ 2023年10月13日 13:32/ 0 赞/ 37 阅读

相关十款浏览器插件，让你拥有更好的浏览器体验

十款浏览器插件，让你拥有更好的浏览器体验作为浏览器的必备神器，其中最为出名的就是谷歌浏览器插件，浏览器插件可以在我们日常使用浏览器的过程中给予我们很大的便利。今天我就为大家

矫情吗；*/ 2023年02月11日 11:28/ 0 赞/ 101 阅读

相关更高级的高级语言应该长什么样？

> 我心目的新编程语言，不是rust dart go swift flutter … 不是说这些不好，是这些都差不多，Java也挺好，谁比谁在某方面领先一点，并不会有什么本质改

川长思鸟来/ 2023年01月19日 08:27/ 0 赞/ 167 阅读

相关从未在一起更让人遗憾_倾听 | 从未拥有和最终失去哪个更遗憾？

![45c1119db0ef139d2e6aeb793bda0b17.png][] @星星陷落从未拥有。就像老薛歌里的爱情有很多种，可我偏爱《其实》，最爱《其

小咪咪/ 2023年01月03日 14:18/ 0 赞/ 125 阅读

相关 Android性能优化：如何让App更快、更稳、更省（含内存、布局优化等）

前言在 `Android`开发中，性能优化策略十分重要因为其决定了应用程序的开发质量：可用性、流畅性、稳定性等，是提高用户留存率的关键本文全面讲解

Dear 丶/ 2022年05月23日 02:13/ 0 赞/ 531 阅读

相关 LeetCode——最长有效括号（更优化方法）

昨天自己做出来了，然后在网上百度了下发现有更巧妙的方法，这里记录一下。参考博客：[https://blog.csdn.net/renjiewen1995/article/d

Bertha 。/ 2022年05月16日 12:15/ 0 赞/ 203 阅读

相关如何让自己拥有更多的时间——《暗时间》阅读笔记（一）

如何让自己拥有更多的时间——《暗时间》阅读笔记（一）好久没有写博文了，最近一段时间我一直在努力地总结自己、寻找方向和阅读书籍，感觉自己和以前相比不再单

旧城等待，/ 2021年11月22日 05:54/ 0 赞/ 261 阅读