All the articles with the tag "optimization".
从数值稳定的 Safe Softmax 出发,推导 Online Softmax 的递推公式,最终理解 FlashAttention 如何将注意力计算融合为单轮遍历的 IO 感知算法。