IULA 03 Soaplab Web Services
[Soaplab version: 2.3.2, build: Mon Nov 25 10:01:40 CET 2019]
|
|
Category | Service name | Description |
---|---|---|
Corpus workbench | ||
corpus_analysis (WSDL) | Corpus analysis bases on the CWB corpus workbench | |
corpus_to_vectors (WSDL) | cat: Crea un fitxer weka arff amb els vectors del corpus. es: Crea un fichero weka arff con los vectores del corpus. en: Makes a weka arff file with the corpus vectors. |
|
cqp_index (WSDL) | CQP indexer Web service Based on the IMS Open Corpus Workbench (CWB) | |
cqp_query (WSDL) | CQP Query Web service Based on the IMS Open Corpus Workbench (CWB) | |
Format conversion | ||
iconv (WSDL) | cat: comanda Linux per a convertir text d'un format a un altre (ex: iconv −f ISO−8859−1 −t UTF−8). es: comando Linux para convertir texto de un formato a otro (ex: iconv −f ISO−8859−1 −t UTF−8). en: Linux command that converts text from one encoding to another encoding (ex: iconv −f ISO−8859−1 −t UTF−8). |
|
split_file (WSDL) | cat es en: Given a file |
|
Lexicon terminology extraction | ||
create_weka_noun_signatures (WSDL) | cat: crea les signatures en format weka pels noms donats o per tots els noms del corpus. es: crea las signaturas en formato weka para los nombres dados o para todos los nombres del corpus. en: create signatures in weka format for the given nouns or for all nouns in corpus. |
|
dt_noun_classifier_abstract (WSDL) | cat: classifica usant un Decision Tree tots els noms d'un corpus, o una llista donada de noms, com a membres o no membres de la classe ABSTRACTE. es: classifica con un Decision Tree todos los nombres de un corpus, o una lista dada de nombres, como miembros o no miembros de la clase ABSTRACTO. en: classify with a Decision Tree all nouns in corpus or a given list of nouns, as members or non-members of ABSTRACT class. |
|
dt_noun_classifier_artifact (WSDL) | cat: classifica usant un Decision Tree tots els noms d'un corpus, o una llista donada de noms, com a membres o no membres de la classe ARTEFACTE. es: classifica con un Decision Tree todos los nombres de un corpus, o una lista dada de nombres, como miembros o no miembros de la clase ARTEFACTO. en: classify with a Decision Tree all nouns in corpus or a given list of nouns, as members or non-members of ARTIFACT class. |
|
dt_noun_classifier_eventive (WSDL) | cat: classifica usant un Decision Tree tots els noms d'un corpus, o una llista donada de noms, com a membres o no membres de la classe EVENTIUS. es: classifica con un Decision Tree todos los nombres de un corpus, o una lista dada de nombres, como miembros o no miembros de la clase EVENTIVOS. en: classify with a Decision Tree all nouns in corpus or a given list of nouns, as members or non-members of EVENTIVE class. |
|
dt_noun_classifier_human (WSDL) | cat: classifica usant un Decision Tree tots els noms d'un corpus, o una llista donada de noms, com a membres o no membres de la classe HUMANS. es: classifica con un Decision Tree todos los nombres de un corpus, o una lista dada de nombres, como miembros o no miembros de la clase HUMANOS. en: classify with a Decision Tree all nouns in corpus or a given list of nouns, as members or non-members of HUMAN class. |
|
dt_noun_classifier_location (WSDL) | cat: classifica usant un Decision Tree tots els noms d'un corpus, o una llista donada de noms, com a membres o no membres de la classe LOCATION. es: classifica con un Decision Tree todos los nombres de un corpus, o una lista dada de nombres, como miembros o no miembros de la clase LOCATION. en: classify with a Decision Tree all nouns in corpus or a given list of nouns, as members or non-members of LOCATION class. |
|
dt_noun_classifier_matter (WSDL) | cat: classifica usant un Decision Tree tots els noms d'un corpus, o una llista donada de noms, com a membres o no membres de la classe MATERIA. es: classifica con un Decision Tree todos los nombres de un corpus, o una lista dada de nombres, como miembros o no miembros de la clase MATERIA. en: classify with a Decision Tree all nouns in corpus or a given list of nouns, as members or non-members of MATTER class. |
|
dt_noun_classifier_process (WSDL) | cat: classifica usant un Decision Tree tots els noms d'un corpus, o una llista donada de noms, com a membres o no membres de la classe PROCES. es: classifica con un Decision Tree todos los nombres de un corpus, o una lista dada de nombres, como miembros o no miembros de la clase PROCESO. en: classify with a Decision Tree all nouns in corpus or a given list of nouns, as members or non-members of PROCESS class. |
|
dt_noun_classifier_semiotic (WSDL) | cat: classifica usant un Decision Tree tots els noms d'un corpus, o una llista donada de noms, com a membres o no membres de la classe SEMIOTIC. es: classifica con un Decision Tree todos los nombres de un corpus, o una lista dada de nombres, como miembros o no miembros de la clase SEMIOTICO. en: classify with a Decision Tree all nouns in corpus or a given list of nouns, as members or non-members of SEMIOTIC class. |
|
dt_noun_classifier_social (WSDL) | cat: classifica usant un Decision Tree tots els noms d'un corpus, o una llista donada de noms, com a membres o no membres de la classe SOCIAL. es: classifica con un Decision Tree todos los nombres de un corpus, o una lista dada de nombres, como miembros o no miembros de la clase SOCIAL. en: classify with a Decision Tree all nouns in corpus or a given list of nouns, as members or non-members of SOCIAL class. |
|
estimate_bayesian_parameters (WSDL) | cat: donat el conjunt de signatures d'entrenament en un fitxer weka (train_file.arff), estimar el pes ("theta") de cada pista usant les frequències de les dades i el coneixement a priori donat al fitxer de priors (priors.csv). Com a paràmetre d'entrada es pot posar la mida que donem a les dades virtuals. es: dado el conjunto de signaturas de entrenamiento en un fichero weka (train_file.arff), estimar el peso ("theta") de cada pista usando las frecuencias de los datos y el conocimiento a priori dado en el fichero de priors (priors.csv). Cómo parámetro de entrada se puede poner la medida que damos a los datos virtuales (peso del prior). en: given the set of training signatures in a weka file (train_file.arff), estimate the weight ("theta") of each cue using data frequencies and prior knowledge given in priors file (priors.csv). As a parameter, we can give the size to give to virtual size (weight of the priors). |
|
merge_list_of_lmf_files (WSDL) | en: Given a list of LMF files given by their URLs create a new file with the information in all files merged | |
merge_lmf_files (WSDL) | en: Given two LMF files, create a new file with the information in both files merged. | |
naive_bayes_classifier (WSDL) | cat: donat un conjunt de signatures en un fitxer weka (test_file.arff), classificar-les usant el fitxer de pesos per cada pista (theta_file.csv). es: dado un conjunto de signaturas en un fichero weka (test_file.arff), classificarlas usando el fichero de pesos para cada pista (theta_file.csv). en: given a set of signatures in a weka file (test_file.arff), classify them using the parameters estimated for each cue (theta_file.csv). |
|
noun_classification_filter (WSDL) | en: Given a LMF file with nouns classified with a score, filter the nouns that have been classified with confidence over a given threshold. | |
tpc_subcat_inductive (WSDL) | Inductive SCF Lexicon Acquisition v2.0 | |
xml_signatures2weka (WSDL) | cat: donat un fitxer de signatures en xml (signatures.xml) i el fitxer d'indicadors (indicators.txt) de quins noms pertanyen o no a la classe, crea un fitxer en format .arff per fer experiments amb el Weka. Atenció: la codificació de caràcters per defecte, tant dels fitxers d'entrada com de sortida, és ISO-8859-1. Es pot canviar usant els paràmetres opcionals, però els dos fitxers d'entrada han d'estar sempre en la matexia codificació, que ha d'estar indicada a la capçalera del xml. es: dado un fichero de signaturas en xml (signatures.xml) y el fichero de indicadores (indicators.txt) de que nombres pertenecen o no a la clase, crea un fichero en formato .arff para hacer experimentos con Weka. Atención: la codificación de carácteres por defecto, tanto de los ficheros de entrada como de salida, es ISO-8859-1. Se puede cambiar usando los parámetros opcionales, pero los dos ficheros de entrada tienen que estar siempre en la misma codificación, que tiene que estar indicada en la cabecera del xml. en: given a xml signatures file (signatures.xml) and the indicators file (indicators.txt) with the nouns that belong ot not to the class, creates a file in .arff format to experiments with Weka. Warning: the default encoding, both in the input and output files, is ISO-8859-1. It may be changed using optional parameters, but the two input files must have the same encofing, which must be indicated in the headers of the xml file. |
|
Statistics analysis | ||
compute_p_cue_class (WSDL) | calculate P(cue|class): probability of seeing a linguistic cue given a lexical class. This probability is computed given the occurrences of cues in a corpus (codified in the signatures file) and the information of belonging or not belonging of these words to different classes (codified in indicators file). The probability is computed for each studied cue in the signatures file and for each class in the indicators file. |
|
compute_p_cue_class_from_weka (WSDL) | calculate P(cue|class): probability of seeing a linguistic cue given a lexical class. This probability is computed given the occurrences of cues in a corpus and the information of belonging or not belonging of these words to different classes. This data is encoded in a weka file |