Chinese BertForSequenceClassification Cased model (from kyleinincubated)

Description

Pretrained BertForSequenceClassification model, adapted from Hugging Face and curated to provide scalability and production-readiness using Spark NLP. autonlp-abbb-622117836 is a Chinese model originally trained by kyleinincubated.

Predicted Entities

传媒, 计算机应用, 化学制药, 电力, 汽车租赁, 拍卖, 电影, 生态保护, 水泥, 园区开发, 广播电视, 港口, 典当, 电信, 种植业, 畜牧业辅助性活动, 房地产租赁, 保障性住房开发, 燃气, 小额贷款公司服务, 保险代理, 资产管理, 包装印刷, 专业公共卫生, 监护设备, 文化艺术产业, 物流, 保险, 燃气设备, 银行, 商业养老金, 融资性担保, 水务, 中药材种植, 农产品初加工, 铁路运输, 新能源发电, 中药生产, 物流配送, 商业健康保险, 农产品加工, 房屋建设, 医疗人工智能, 物联网, 高等教育, 环保工程, 珠宝首饰, 学前教育, 高速公路服务区, 娱乐, 煤炭, 住宿, 商品住房开发, 疾病预防, 高速公路建设, 集成电路, 医疗服务, 职业技能培训, 医疗器械, 贸易, 燃气供应, 葡萄酒, 航空货运, 证券, 机场, 污水处理, 临床检验, 中药, 农村资金互助社服务, 人身保险, 锂, 交通运输, 水电, 公用事业, 纺织服装制造, 网络安全监测, 畜禽粪污处理, 乘用车, 畜禽养殖, 航空运输, 水利工程, 铁路建设, 物业管理, 种子生产, 保险经纪, 塑料, 广播, 房地产, 通信设备, 文化, 集成电路设计, 再保险, 工业园区开发, 外贸, 水产品, 互联网安全服务, 橡胶, 互联网服务, 证券交易, 贷款公司, 建筑材料, 物业服务, 兽药产品, 健康体检, 教育, 钢铁, 民宿, 家具, 基金, 基层医疗卫生, 餐饮, 普通高中教育, 建筑业, 房屋建筑, 卫星, 疫苗, 图书馆, 航运, 林业, 特殊教育, 体育场馆建筑, 铝, 渔业, 农业, 公交, 信托, 信息技术, 中等职业学校教育, 终端设备, 森林防火, 证券期货监管服务, 小额贷款公司, 互联网平台, 供水, 博物馆, 通信, 外卖, 期货, 公募基金, 电源设备, 铁路货物运输, 房地产中介, 电视, 水产养殖, 旅游综合, 有色金属, 传感器设计, 建筑设计, 内贸, 技能培训, 科技园区开发, 物联网技术, 饲料, 体育, 医院, 高速公路, 超市, 运行维护服务

Download Copy S3 URI

How to use

documentAssembler = DocumentAssembler() \
    .setInputCol("text") \
    .setOutputCol("document")

tokenizer = Tokenizer() \
    .setInputCols("document") \
    .setOutputCol("token")

seq_classifier = BertForSequenceClassification.pretrained("bert_classifier_autonlp_abbb_622117836","zh") \
    .setInputCols(["document", "token"]) \
    .setOutputCol("class")

pipeline = Pipeline(stages=[documentAssembler, tokenizer, seq_classifier])

data = spark.createDataFrame([["PUT YOUR STRING HERE"]]).toDF("text")

result = pipeline.fit(data).transform(data)

val documentAssembler = new DocumentAssembler()
      .setInputCols(Array("text"))
      .setOutputCols(Array("document"))

val tokenizer = new Tokenizer()
    .setInputCols("document")
    .setOutputCol("token")

val seq_classifier = BertForSequenceClassification.pretrained("bert_classifier_autonlp_abbb_622117836","zh")
    .setInputCols(Array("document", "token"))
    .setOutputCol("class")

val pipeline = new Pipeline().setStages(Array(documentAssembler, tokenizer, seq_classifier))

val data = Seq("PUT YOUR STRING HERE").toDS.toDF("text")

val result = pipeline.fit(data).transform(data)

Model Information

Model Name:	bert_classifier_autonlp_abbb_622117836
Compatibility:	Spark NLP 5.1.4+
License:	Open Source
Edition:	Official
Input Labels:	[document, token]
Output Labels:	[class]
Language:	zh
Size:	383.8 MB
Case sensitive:	true
Max sentence length:	256

References

https://huggingface.co/kyleinincubated/autonlp-abbb-622117836

PREVIOUSEnglish BertForSequenceClassification Cased model (from FinanceInc)

NEXTEnglish BertForSequenceClassification Cased model (from astarostap)