Description
Pretrained RoBertaForSequenceClassification model, adapted from Hugging Face and curated to provide scalability and production-readiness using Spark NLP. jurisbert-class-tratados-internacionales-sistema-universal is a Spanish model orginally trained by hackathon-pln-es.
Predicted Entities
Convención sobre la Eliminación de todas las formas de Discriminación contra la Mujer, Convención sobre los Derechos de las Personas con Discapacidad, Convención Internacional Sobre la Eliminación de Todas las Formas de Discriminación Racial, Convención contra la Tortura y otros Tratos o Penas Crueles, Inhumanos o Degradantes, Convención Internacional sobre la Protección de los Derechos de todos los Trabajadores Migratorios y de sus Familias, Convención de los Derechos del Niño, Pacto Internacional de Derechos Económicos, Sociales y Culturales, Pacto Internacional de Derechos Civiles y Políticos
How to use
documentAssembler = DocumentAssembler() \
.setInputCol("text") \
.setOutputCol("document")
sentenceDetector = SentenceDetectorDLModel.pretrained("sentence_detector_dl", "xx")\
.setInputCols(["document"])\
.setOutputCol("sentence")
tokenizer = Tokenizer() \
.setInputCols("sentence") \
.setOutputCol("token")
tokenClassifier = RoBertaForSequenceClassification.pretrained("roberta_jurisbert_class_tratados_internacionales_sistema_universal","es") \
.setInputCols(["sentence", "token"]) \
.setOutputCol("class")
pipeline = Pipeline(stages=[documentAssembler, sentenceDetector, tokenizer, tokenClassifier])
data = spark.createDataFrame([["Me encanta Spark NLP"]]).toDF("text")
result = pipeline.fit(data).transform(data)
val documentAssembler = new DocumentAssembler()
.setInputCol("text")
.setOutputCol("document")
val sentenceDetector = SentenceDetectorDLModel.pretrained("sentence_detector_dl", "xx")
.setInputCols(Array("document"))
.setOutputCol("sentence")
val tokenizer = new Tokenizer()
.setInputCols(Array("sentence"))
.setOutputCol("token")
val tokenClassifier = RoBertaForSequenceClassification.pretrained("roberta_jurisbert_class_tratados_internacionales_sistema_universal","es")
.setInputCols(Array("sentence", "token"))
.setOutputCol("class")
val pipeline = new Pipeline().setStages(Array(documentAssembler,sentenceDetector, tokenizer, tokenClassifier))
val data = Seq("Me encanta Spark NLP").toDF("text")
val result = pipeline.fit(data).transform(data)
import nlu
nlu.load("es.classify.tratados.roberta.by_hackathon_pln_es").predict("""Me encanta Spark NLP""")
Model Information
| Model Name: | roberta_jurisbert_class_tratados_internacionales_sistema_universal |
| Compatibility: | Spark NLP 3.4.4+ |
| License: | Open Source |
| Edition: | Official |
| Input Labels: | [document, token] |
| Output Labels: | [class] |
| Language: | es |
| Size: | 466.6 MB |
| Case sensitive: | true |
| Max sentence length: | 128 |
References
https://huggingface.co/hackathon-pln-es/jurisbert-class-tratados-internacionales-sistema-universal