Spaces:

pythainlp
/

api

Paused

wannaphong commited on Apr 26

Commit

b9def7b

1 Parent(s): f7003d5

Update docs

Files changed (3) hide show

app.py CHANGED Viewed

@@ -26,7 +26,7 @@ app = FastAPI(
     # },
     license_info={
         "name": "Apache 2.0",
-        "identifier": "Apache 2.0",
     },
 )

     # },
     license_info={
         "name": "Apache 2.0",
+        "url": "https://www.apache.org/licenses/LICENSE-2.0.html",
     },
 )

routers/soundex.py CHANGED Viewed

@@ -19,5 +19,10 @@ class SoundexEngine(str, Enum):
 def soundex(text: str, engine: SoundexEngine = "udom83"):
     """
     This api converts Thai text into phonetic code.
     """
     return {"soundex": py_soundex(text=text, engine=engine)}

 def soundex(text: str, engine: SoundexEngine = "udom83"):
     """
     This api converts Thai text into phonetic code.
+    ## Input
+    = **text**:  A word that want into phonetic code.
+    - **engine**: Soundex Engine (default is udom83)
     """
     return {"soundex": py_soundex(text=text, engine=engine)}

routers/tokenize.py CHANGED Viewed

@@ -43,6 +43,11 @@ class SentTokenizeEngine(BaseModel):
 def word_tokenize(text: str, engine: WordTokenizeEngine = "newmm"):
     """
     Word tokenize or word segmentation for Thai language
     """
     return {"words": py_word_tokenize(text=text, engine=engine)}
@@ -50,7 +55,12 @@ def word_tokenize(text: str, engine: WordTokenizeEngine = "newmm"):
 @router.post('/subword_tokenize', response_model=SubwordTokenizeResponse)
 def subword_tokenize(text: str, engine: SubwordTokenizeEngine = "tcc"):
     """
-    subword tokenize or subword segmentation for Thai language
     """
     return {"subwords": py_subword_tokenize(text=text, engine=engine)}
@@ -59,5 +69,10 @@ def subword_tokenize(text: str, engine: SubwordTokenizeEngine = "tcc"):
 def sent_tokenize(text: str, engine: SentTokenizeEngine = "crfcut"):
     """
     Thai sentence segmentation
     """
     return {"sents": py_sent_tokenize(text=text, engine=engine)}

 def word_tokenize(text: str, engine: WordTokenizeEngine = "newmm"):
     """
     Word tokenize or word segmentation for Thai language
+    ## Input
+    = **text**: Text that want to tokenize.
+    - **engine**: Word Tokenize Engine (default is newmm)
     """
     return {"words": py_word_tokenize(text=text, engine=engine)}
 @router.post('/subword_tokenize', response_model=SubwordTokenizeResponse)
 def subword_tokenize(text: str, engine: SubwordTokenizeEngine = "tcc"):
     """
+    Subword tokenize or subword segmentation for Thai language
+    ## Input
+    = **text**: Text that want to tokenize.
+    - **engine**: Sub word Tokenize Engine (default is tcc)
     """
     return {"subwords": py_subword_tokenize(text=text, engine=engine)}
 def sent_tokenize(text: str, engine: SentTokenizeEngine = "crfcut"):
     """
     Thai sentence segmentation
+    ## Input
+    = **text**: Text that want to tokenize.
+    - **engine**: Sentence Tokenize Engine (default is crfcut)
     """
     return {"sents": py_sent_tokenize(text=text, engine=engine)}