English pipeline_image_classifier_vit_string_instrument_detector ViTForImageClassification from rexoscare

Description

Pretrained VIT model, adapted from Hugging Face and curated to provide scalability and production-readiness using Spark NLP.image_classifier_vit_string_instrument_detector is a English model originally trained by rexoscare.

Predicted Entities

Banjo, Guitar, Mandolin, Ukulele

Download Copy S3 URI

How to use

    pipeline = PretrainedPipeline('pipeline_image_classifier_vit_string_instrument_detector', lang = 'en')
    annotations =  pipeline.transform(imageDF)
    

    val pipeline = new PretrainedPipeline("pipeline_image_classifier_vit_string_instrument_detector", lang = "en")
    val annotations = pipeline.transform(imageDF)
    

Model Information

Model Name:	pipeline_image_classifier_vit_string_instrument_detector
Type:	pipeline
Compatibility:	Spark NLP 4.2.1+
License:	Open Source
Edition:	Official
Language:	en
Size:	321.9 MB

Included Models

ImageAssembler
ViTForImageClassification

PREVIOUSEnglish pipeline_image_classifier_vit_south_indian_foods ViTForImageClassification from Amrrs

NEXTEnglish pipeline_image_classifier_vit_taco_or_what ViTForImageClassification from osanseviero