Removed casts to fp32

Signed-off-by: Chris Granger <[email protected]>
CGranger-sorenson · Jul 15, 2024 · c6eef97 · c6eef97
1 parent a1e7739
commit c6eef97
Showing 1 changed file with 0 additions and 9 deletions.
diff --git a/nemo/collections/asr/parts/submodules/multi_head_attention.py b/nemo/collections/asr/parts/submodules/multi_head_attention.py
@@ -135,9 +135,6 @@ def forward(self, query, key, value, mask, pos_emb=None, cache=None):
         """
         key, value, query, cache = self.update_cache(key=key, value=value, query=query, cache=cache)
 
-        if torch.is_autocast_enabled():
-            query, key, value = query.to(torch.float32), key.to(torch.float32), value.to(torch.float32)
-
         q, k, v = self.forward_qkv(query, key, value)
         scores = torch.matmul(q, k.transpose(-2, -1)) / self.s_d_k
         out = self.forward_attention(v, scores, mask)
@@ -217,9 +214,6 @@ def forward(self, query, key, value, mask, pos_emb, cache=None):
         """
         key, value, query, cache = self.update_cache(key=key, value=value, query=query, cache=cache)
 
-        if torch.is_autocast_enabled():
-            query, key, value = query.to(torch.float32), key.to(torch.float32), value.to(torch.float32)
-
         q, k, v = self.forward_qkv(query, key, value)
         q = q.transpose(1, 2)  # (batch, time1, head, d_k)
 
@@ -325,9 +319,6 @@ def forward(self, query, key, value, pad_mask, pos_emb, cache=None):
 
         key, value, query, cache = self.update_cache(key=key, value=value, query=query, cache=cache)
 
-        if torch.is_autocast_enabled():
-            query, key, value = query.to(torch.float32), key.to(torch.float32), value.to(torch.float32)
-
         q, k, v = self.forward_qkv(query, key, value)
         n_batch, _, T, _ = q.size()