English image_classifier_vit_base_patch16_224_in21k_aidSat ViTForImageClassification from YKXBCi

Description

Pretrained VIT model, adapted from Hugging Face and curated to provide scalability and production-readiness using Spark NLP.image_classifier_vit_base_patch16_224_in21k_aidSat is a English model originally trained by YKXBCi.

Predicted Entities

Square, Farmland, BaseballField, Park, Commercial, Pond, Airport, SparseResidential, Church, School, Viaduct, Stadium, Desert, BareLand, MediumResidential, Center, Industrial, Playground, Port, DenseResidential, StorageTanks, Beach, Bridge, Mountain, River, Meadow, Resort, Parking, Forest, RailwayStation

Download Copy S3 URI

How to use

image_assembler = ImageAssembler() \
    .setInputCol("image") \
    .setOutputCol("image_assembler")

imageClassifier = ViTForImageClassification \
    .pretrained("image_classifier_vit_base_patch16_224_in21k_aidSat", "en")\
    .setInputCols("image_assembler") \
    .setOutputCol("class")

pipeline = Pipeline(stages=[
    image_assembler,
    imageClassifier,
])

pipelineModel = pipeline.fit(imageDF)

pipelineDF = pipelineModel.transform(imageDF)

val imageAssembler = new ImageAssembler()
.setInputCol("image")
.setOutputCol("image_assembler")

val imageClassifier = ViTForImageClassification
.pretrained("image_classifier_vit_base_patch16_224_in21k_aidSat", "en")
.setInputCols("image_assembler")
.setOutputCol("class")

val pipeline = new Pipeline().setStages(Array(imageAssembler, imageClassifier))

val pipelineModel = pipeline.fit(imageDF)

val pipelineDF = pipelineModel.transform(imageDF)

import nlu
import requests
response = requests.get('https://raw.githubusercontent.com/JohnSnowLabs/spark-nlp/master/docs/assets/images/hen.JPEG')
with open('hen.JPEG', 'wb') as f:
    f.write(response.content)
nlu.load("en.classify_image.base_patch16_224_in21k_aidSat").predict("hen.JPEG")

Model Information

Model Name:	image_classifier_vit_base_patch16_224_in21k_aidSat
Compatibility:	Spark NLP 4.1.0+
License:	Open Source
Edition:	Official
Input Labels:	[image_assembler]
Output Labels:	[class]
Language:	en
Size:	322.0 MB

PREVIOUSEnglish image_classifier_vit_base_patch16_224_finetuned_pneumothorax ViTForImageClassification from mrm8488

NEXTEnglish image_classifier_vit_base_patch16_224_in21k_bantai_v1 ViTForImageClassification from AykeeSalazar