Description
Pretrained BertForSequenceClassification model, adapted from Hugging Face and curated to provide scalability and production-readiness using Spark NLP. Non_CL
is a English model originally trained by yuan1729
.
Predicted Entities
個人資料保護法
, 竊盜犯贓物犯保安處分條例
, 洗錢防制法
, 商業會計法
, 性騷擾防治法
, 臺灣地區與大陸地區人民關係條例
, 廢棄物清理法
, 著作權法
, 藥事法
, 證券交易法
, 稅捐稽徵法
, 道路交通管理處罰條例
, 電信法
, 中華民國九十六年罪犯減刑條例
, 商標法
, 道路交通安全規則
, 道路交通標誌標線號誌設置規則
, 律師法
, 貪污治罪條例
, 家庭暴力防治法
, 公設辯護人條例
, 通訊保障及監察法
, 轉讓毒品加重其刑之數量標準
, 毒品危害防制條例
, 中華民國憲法
, 就業服務法
, 公司法
, 陸海空軍刑法
, 兒童及少年福利與權益保障法
, 戶籍法
, 兒童及少年性剝削防制條例
, 森林法
, 妨害兵役治罪條例
, 管制藥品管理條例
, 組織犯罪防制條例
, 公職人員選舉罷免法
, 懲治走私條例
, 職業安全衛生法
, 性侵害犯罪防治法
, 水土保持法
, 槍砲彈藥刀械管制條例
, 入出國及移民法
, 罰金罰鍰提高標準條例
, 民法
, 電子遊戲場業管理條例
, 銀行法
, 軍事審判法
, 區域計畫法
, 政府採購法
How to use
documentAssembler = DocumentAssembler() \
.setInputCol("text") \
.setOutputCol("document")
tokenizer = Tokenizer() \
.setInputCols("document") \
.setOutputCol("token")
sequenceClassifier_loaded = BertForSequenceClassification.pretrained("bert_classifier_non_cl","en") \
.setInputCols(["document", "token"]) \
.setOutputCol("class")
pipeline = Pipeline(stages=[documentAssembler, tokenizer,sequenceClassifier_loaded])
data = spark.createDataFrame([["PUT YOUR STRING HERE"]]).toDF("text")
result = pipeline.fit(data).transform(data)
val documentAssembler = new DocumentAssembler()
.setInputCol("text")
.setOutputCol("document")
val tokenizer = new Tokenizer()
.setInputCols(Array("document"))
.setOutputCol("token")
val sequenceClassifier_loaded = BertForSequenceClassification.pretrained("bert_classifier_non_cl","en")
.setInputCols(Array("document", "token"))
.setOutputCol("class")
val pipeline = new Pipeline().setStages(Array(documentAssembler, tokenizer,sequenceClassifier_loaded))
val data = Seq("PUT YOUR STRING HERE").toDF("text")
val result = pipeline.fit(data).transform(data)
Model Information
Model Name: | bert_classifier_non_cl |
Compatibility: | Spark NLP 5.1.4+ |
License: | Open Source |
Edition: | Official |
Input Labels: | [document, token] |
Output Labels: | [class] |
Language: | en |
Size: | 383.4 MB |
Case sensitive: | true |
Max sentence length: | 256 |
References
References
- https://huggingface.co/yuan1729/Non_CL