racineai
/

QwenAmann-4B-dse

Visual Document Retrieval

vision-language

document-embedding

Model card Files Files and versions

TW3Partners commited on Oct 19

Commit

3c4c7bf

·

verified ·

1 Parent(s): 56dab4a

Update README.md

Files changed (1) hide show

README.md +2 -0

README.md CHANGED Viewed

@@ -31,6 +31,8 @@ A multimodal vision-language model specialized for multilingual technical docume
 QwenAmann-4B-dse is a 4B parameter vision-language model designed for efficient retrieval of technical documentation. It directly encodes document screenshots into embeddings, preserving all information including text, images, and layout without requiring separate content extraction.
 ## Performance
 ### ENERGY Benchmark (racineai/Open-VLM-Retrieval-Leaderboard)

 QwenAmann-4B-dse is a 4B parameter vision-language model designed for efficient retrieval of technical documentation. It directly encodes document screenshots into embeddings, preserving all information including text, images, and layout without requiring separate content extraction.
+![Racine QwenAmann](https://cdn-uploads.huggingface.co/production/uploads/659826211ec4d9b9a1f2ef3a/bJnqVmcEuprC9-gxNw579.png)
 ## Performance
 ### ENERGY Benchmark (racineai/Open-VLM-Retrieval-Leaderboard)