izmyonの日記

奈良の山奥で研究にいそしむ大学院生の学習記録。

2023-11-01から1ヶ月間の記事一覧

Understanding RetNet①: Theory of Retention

In a paper of RetNet, regarded as a successor to Transformer, particularly in Chapter Two, the architecture of RetNet is explained. However, the formula in the paper is a little confusing. In this post, the details of formula is explained …

RetNetを完全に理解する①:Retentionメカニズム

Transformerの後継と称されるRetNetの以下の論文中にて、特に二章で解説されるRetNetのアーキテクチャについて、行間を埋めながら解説する。 arxiv.org *自分の理解をもとに書いているので、違っているようでしたらコメントください。 Retentive Network Ret…