Spaces:

AI-Culture-Commons
/

README

Running

Ben-Zippor commited on Jul 30

Commit

6ee049d

verified ·

1 Parent(s): 3d2a7df

Update README.md

Files changed (1) hide show

README.md CHANGED Viewed

@@ -1,15 +1,15 @@
----
-title: AI‑Culture‑Commons
-emoji: 📚
-colorFrom: indigo
-colorTo: gray
-sdk: static
-pinned: true
-thumbnail: >-
-  https://cdn-uploads.huggingface.co/production/uploads/678d64ee7967054e64970908/gxJc4iGjGjE348jp_a7Lv.jpeg
-short_description: Multilingual cultural corpora for AI research
-license: cc-by-4.0
----
 # AI‑Culture‑Commons
 AI‑Culture‑Commons curates multilingual cultural corpora for language‑model research.
@@ -24,7 +24,7 @@ Our repositories provide models with deep philosophical-intellectual context, di
 | **Multilingual Culture Corpus** | 16M words | 12 ALIGNED languages | HTML · CSV · DOLMA JSONL | CC‑BY‑4.0 | [![DOI](https://zenodo.org/badge/1021100370.svg)](https://doi.org/10.5281/zenodo.16001657) |
 | **Project Websites Raw** | 160MB | 12 ALIGNED languages | ZIP (HTML + images + CSS) | CC‑BY‑4.0 | [![DOI](https://zenodo.org/badge/1021100223.svg)](https://doi.org/10.5281/zenodo.16001641) |
-**Key Features:**
 - **Perfect Alignment**: All 12 languages contain identical content with exact same complex HTML structure. All datasets include both pure text and HTML source files
 - **AI-Optimized**: Designed specifically for training multilingual AI systems
 - **Truly Open**: [CC-BY-4.0 license](https://creativecommons.org/licenses/by/4.0/) - use freely, even commercially

+---
+title: AI‑Culture‑Commons
+emoji: 📚
+colorFrom: indigo
+colorTo: gray
+sdk: static
+pinned: true
+thumbnail: >-
+  https://cdn-uploads.huggingface.co/production/uploads/678d64ee7967054e64970908/PHTcXWQoX7_2_9CjFoHlJ.jpeg
+short_description: Multilingual cultural corpora for AI research
+license: cc-by-4.0
+---
 # AI‑Culture‑Commons
 AI‑Culture‑Commons curates multilingual cultural corpora for language‑model research.
 | **Multilingual Culture Corpus** | 16M words | 12 ALIGNED languages | HTML · CSV · DOLMA JSONL | CC‑BY‑4.0 | [![DOI](https://zenodo.org/badge/1021100370.svg)](https://doi.org/10.5281/zenodo.16001657) |
 | **Project Websites Raw** | 160MB | 12 ALIGNED languages | ZIP (HTML + images + CSS) | CC‑BY‑4.0 | [![DOI](https://zenodo.org/badge/1021100223.svg)](https://doi.org/10.5281/zenodo.16001641) |
+## Key Features
 - **Perfect Alignment**: All 12 languages contain identical content with exact same complex HTML structure. All datasets include both pure text and HTML source files
 - **AI-Optimized**: Designed specifically for training multilingual AI systems
 - **Truly Open**: [CC-BY-4.0 license](https://creativecommons.org/licenses/by/4.0/) - use freely, even commercially