Estoy tratando de hacer algunos de clasificación de textos, el uso de Textblob. Soy el primero el modelo de formación y registrar mediante pepinillo como se muestra a continuación.

import pickle
from textblob.classifiers import NaiveBayesClassifier

with open('sample.csv', 'r') as fp:
     cl = NaiveBayesClassifier(fp, format="csv")

f = open('sample_classifier.pickle', 'wb')
pickle.dump(cl, f)
f.close()

Y cuando intento ejecutar este archivo:

import pickle
f = open('sample_classifier.pickle', encoding="utf8")
cl = pickle.load(f)    
f.close()

Me sale este error:

UnicodeDecodeError: ‘utf-8’ codec no puede decodificar byte 0x80 en la posición
0: no válido inicio byte

Siguientes son el contenido de mi muestra.csv:

Mi SQL no está funcionando correctamente en todo. Esta fue una elección equivocada, SQL

He cuestiones. Por favor, responda de inmediato, el Apoyo

Donde se me va mal aquí? Por favor, ayudar.

InformationsquelleAutor 90abyss | 2015-10-05

2 Comentarios

  1. 102

    Eligiendo open el archivo en modo de wb, usted está eligiendo para escribir en binario. No hay ninguna codificación de caracteres que se aplica.

    Por lo tanto para leer este archivo, usted debe simplemente open en el modo de rb.

    • Muchas gracias! Totalmente trabajado!
    • Hay una razón para usar wb al guardar el pepinillo? o es que hay un modo de que uno puede usar para guardar los pepinillos que no requeriría de apertura con rb modo?
    • Yo uso wb debido a algún problema de que aún tengo que arreglar me impide el uso de w con la vinagreta. Se queja acerca de la escritura de bytes en lugar de cadenas.
    • Gracias… usted salvó mi día
    • Trabajó para mí…
  2. 21

    Creo que se debe abrir el archivo como

    f = open('sample_classifier.pickle', 'rb')
    cl = pickle.load(f)   

    Usted no debería tener que decodificar. pickle.load le dará una copia exacta de lo que se guardó. En este punto, debe ser capaz de trabajar con cl como si sólo lo creó.

Dejar respuesta

Please enter your comment!
Please enter your name here