quarta-feira, 19 de julho de 2017

Usando o parser de Stanford com Python

Na última postagem, mostrei como treinar e usar o parser de Stanford com textos em português. Isso foi bastante útil para muita gente que precisa de análise sintática, mas outro ponto relevante é que muita coisa em PLN é feita em Python, enquanto o parser de Stanford é uma ferramente em Java.

Isso é bem inconveniente se você já tem ou pretende desenvolver um sistema em Python e só queria incluir o parser. Uma possível solução é fazer chamadas ao Java para rodar o parser para um determinado texto, o que até funciona. O problema é que cada chamada precisa carregar o parser em memória, o que leva um certo tempo. Esse tempo de leitura pode ser menos de um minuto dependendo do hardware, mas ao rodar com vários textos diferentes, torna-se um grande gargalo.