ANALITICA TEXTUAL

ANALITICA TEXTUAL

INTRODUCCIÓN A LA CIENCIA Y APLICACIÓN DEL ANÁLISIS DE INFORMACIÓN NO ESTRUCTURA

JOHN ATKINSON ABUTRIDY

24,80 €
IVA inclòs
Editorial:
MARCOMBO, S.A.
Any d'edició:
2023
Matèria
Ciencias/ecologia/tecnologia
ISBN:
978-84-267-3613-0
Pàgines:
256

Disponibilitat:

  • LLIBRERIA EL PUERTODisponible en 1 setmana
  • AKELARRE KULTURGUNEADisponible en 1 setmana

1 ANALÍTICA TEXTUAL ......................................................................................... 25
1.1 INTRODUCCIÓN .................................................................................... 25
1.2 MINERÍA DE TEXTOS Y ANALÍTICA TEXTUAL ......................................... 28
1.3 TAREAS Y APLICACIONES ...................................................................... 30
1.4 EL PROCESO DE LA ANALÍTICA TEXTUAL ............................................... 33
1.5 RESUMEN .............................................................................................. 36
1.6 PREGUNTAS .......................................................................................... 37
2 PROCESAMIENTO DEL LENGUAJE NATURAL .................................................... 39
2.1 INTRODUCCIÓN .................................................................................... 39
2.2 PROCESAMIENTO DEL LENGUAJE NATURAL ......................................... 41
2.3 NIVELES Y TAREAS EN NLP .................................................................... 42
2.3.1 Fonología .............................................................................................. 43
2.3.2 Morfología ............................................................................................ 44
2.3.3 Léxico .................................................................................................... 45
2.3.4 Sintaxis .................................................................................................. 51
2.3.5 Semántica ............................................................................................. 55
2.3.6 Razonamiento y pragmática ................................................................. 60
2.4 RESUMEN .............................................................................................. 60
2.5 EJERCICIOS ............................................................................................ 62
2.5.1 Análisis morfológico ............................................................................. 62
2.5.2 Análisis léxico ........................................................................................ 66
2.5.3 Análisis sintáctico ................................................................................. 68
3 EXTRACCIÓN DE INFORMACIÓN ....................................................................... 71
3.1 INTRODUCCIÓN .................................................................................... 71
3.2 EXTRACCIÓN DE INFORMACIÓN BASADA EN REGLAS .......................... 75
3.3 EXTRACCIÓN DE ENTIDADES NOMBRADAS .......................................... 76
3.3.1 Modelos de N-gramas .......................................................................... 78
3.4 EXTRACCIÓN DE RELACIONES ............................................................... 81
3.5 EVALUACIÓN ......................................................................................... 86
3.6 RESUMEN .............................................................................................. 88
3.7 EJERCICIOS ............................................................................................ 90
3.7.1 Extracción vía expresiones regulares ................................................... 90
3.7.2 Reconocimiento de entidades nombradas (NER) ................................. 94
4 REPRESENTACIÓN DE DOCUMENTOS .............................................................. 97
4.1 INTRODUCCIÓN .................................................................................... 97
4.2 INDEXACIÓN DE DOCUMENTOS ........................................................... 99
4.3 MODELOS DE ESPACIO VECTORIAL .................................................... 101
4.3.1 Modelo de representación booleana ................................................. 102
4.3.2 Modelo de frecuencia de términos .................................................... 103
4.3.3 Modelo de frecuencia inversa de documentos .................................. 104
4.4 RESUMEN ........................................................................................... 106
4.5 EJERCICIOS .......................................................................................... 107
4.5.1 Modelo de representación TFxIDF ..................................................... 107
5 ANÁLISIS DE REGLAS DE ASOCIACIÓN ............................................................ 115
5.1 INTRODUCCIÓN .................................................................................. 115
5.2 PATRONES DE ASOCIACIÓN ................................................................ 116
5.3 EVALUACIÓN ...................................................................................... 118
5.3.1 Support ............................................................................................... 118
5.3.2 Confidence ......................................................................................... 119
5.3.3 Lift ....................................................................................................... 119
5.4 GENERACIÓN DE REGLAS DE ASOCIACIÓN ......................................... 120
5.5 RESUMEN ........................................................................................... 124
5.6 EJERCICIOS .......................................................................................... 126
5.6.1 Extracción de reglas de asociación ..................................................... 126
6 ANÁLISIS SEMÁNTICO BASADO EN CORPUS .................................................. 131
6.1 INTRODUCCIÓN .................................................................................. 131
6.2 ANÁLISIS BASADO EN CORPUS ........................................................... 133
6.3 ANÁLISIS SEMÁNTICO LATENTE ......................................................... 135
6.3.1 Generación de vectores con LSA ........................................................ 136
6.4 WORD2VEC ......................................................................................... 140
6.4.1 Aprendizaje de embeddings en CBOW ............................................... 143
6.4.2 Predicción e interpretación de embeddings ...................................... 146
6.5 RESUMEN ........................................................................................... 148
6.6 EJERCICIOS .......................................................................................... 149
6.6.1 Análisis semántico latente (LSA) ......................................................... 149
6.6.2 Modelo de Word embedding del tipo Word2Vec .............................. 156
7 AGRUPACIÓN DE DOCUMENTOS ................................................................... 161
7.1 INTRODUCCIÓN .................................................................................. 161
7.2 CLUSTERING DE DOCUMENTOS .......................................................... 163
7.3 CLUSTERING K-MEANS ........................................................................ 169
7.4 MAPAS AUTOORGANIZATIVOS ........................................................... 172
7.4.1 Aprendizaje de mapas topológicos ..................................................... 174
7.5 RESUMEN ............................................................................................ 178
7.6 EJERCICIOS .......................................................................................... 179
7.6.1 Clustering via K-means ....................................................................... 179
7.6.2 Clustering vía mapas autoorganizativos ............................................. 185
8 MODELAMIENTO DE TÓPICOS ........................................................................ 188
8.1 INTRODUCCIÓN .................................................................................. 189
8.2 MODELAMIENTO DE TÓPICOS ............................................................ 191
8.3 LATENT DIRICHLET ALLOCATION ........................................................ 193
8.4 EVALUACIÓN ....................................................................................... 200
8.5 RESUMEN ............................................................................................ 202
8.6 EJERCICIOS .......................................................................................... 203
8.6.1 Modelamiento de tópicos con LDA .................................................... 203
9 CATEGORIZACIÓN DE DOCUMENTOS ............................................................. 209
9.1 INTRODUCCIÓN .................................................................................. 209
9.2 MODELOS DE CATEGORIZACIÓN ........................................................ 211
9.3 CLASIFICACIÓN BAYESIANA ................................................................ 214
9.4 CATEGORIZACIÓN POR MÁXIMA ENTROPÍA ...................................... 218
9.5 EVALUACIÓN ....................................................................................... 223
9.6 RESUMEN ............................................................................................ 225
9.7 EJERCICIOS .......................................................................................... 227
9.7.1 Categorización con Naïve Bayes ......................................................... 227
9.7.2 Categorización con Máxima Entropía ................................................. 232
10 CONCLUSIONES ................................................................................................. 239
Bibliografía ............................................................................................................. 244
Glosario .................................................................................................................. 250
Índice onomástico .................................................................................................. 253

Si desea obtener o entender sus propios datos textuales para descubrir y detectar automáticamente conocimiento valioso para su empresa, ha llegado al libro indicado. En él se proporciona una introducción a la ciencia y a las aplicaciones de la analítica textual o minería de textos (text mining) que le permitirá examinar fuentes de información no estructurada textual electrónica. La ciencia de la minería de textos es capaz de identificar información relevante y descubrir patrones ocultos desde grandes conjuntos de datos de naturaleza textual. Estos descubrimientos pueden convertirse en una forma estructurada que analizar e integrar en otro tipo de sistemas tradicionales de apoyo en la toma de decisiones (por ejemplo, en la inteligencia de negocios, en las bases de datos relacionales y en eldata warehouses).

Articles relacionats

  • TU CORAZÓN TIENE ALGO QUE DECIRTE
    DR. AURELIO ROJAS,
    TU CORAZÓN NO SOLO LATE: TAMBIÉN ENVÍA SEÑALES SOBRE TU SALUD QUE MUCHAS VECES PASAN DESAPERCIBIDAS.El insomnio que se repite, la fatiga que no desaparece, la irritabilidad sin motivo o la dificultad para concentrarte no son simples molestias… son señales. Señales de que tu cuerpo y tu corazón llevan tiempo pidiéndote atención antes de que aparezca la enfermedad. El Dr. Aurelio...

    18,95 €

  • LAS CHICAS GILMORE. NUEVAS ILUSIONES
    CLARK, CATHERINE / PAI, HELEN
    Risas, sueños y mucho café...REGRESA JUNTO A LORELAI Y RORY A LA SERIE MÁS ENTRAÑABLE DE LA TELEVISIÓN CON LA NOVELA OFICIAL DE LAS CHICAS GILMORE. ¡El amor está en el aire en Stars Hollow!Todo el mundo está muy emocionado por la boda entre Lorelai y Max Medina, el profesor de inglés de Chilton. En cuanto a Rory, entre las salidas con Dean, la rivalidad con Paris y la larga lis...

    15,90 €

  • EN BUSCA DEL ÚLTIMO CONTINENTE
    PELÁEZ, JAVIER
    Una obra que evoca la emoción de la exploración científica a través de una prosa que huele a viento helado, madera y sal. En 1913 un navío zarpó de Alaska para cartografiar y descubrir el último de los continentes. En aquel barco viajarían científicos de todo tipo. Era la mayor expedición científica al Ártico que jamás se había concebido. Esta insólita búsqueda del último conti...

    21,90 €

  • SUR/NORTE
    IVETIC, EGIDIO
    ¿Qué es hoy el Mediterráneo? Una imagen, ante todo: rostros desesperados, pateras, oleaje. Somos testigos de una dramática migración hacia las costas de Europa. El Mediterráneo se ha convertido en un umbral, un segmento de la frontera global que separa el Norte del Sur, el mundo de los privilegiados de aquellos que simplemente aspiran a una vida digna. Durante milenios, el Medi...

    11,95 €

  • SALUD DESDE EL ORIGEN
    GOMEZ, BLANCA / SANCHEZ, NESTOR
    Una guía clara y cercana que te invita a vivir una vida más plena, más amable y más saludable. Vivimos inflamados, cansados y desincronizados en un mundo que empuja en contra de nuestra fisiología. Aquí no vas a encontrar una promesa mágica ni una moda pasajera. Vas a encontrar un mapa claro y amable -basado en más de veinte años de experiencia clínica y ciencia útil- para volv...

    24,90 €

  • ME QUIERES O QUE QUIERES?
    MASCARAQUE, RAQUEL
    La periodista y divulgadora Raquel Mascaraque desvela los secretos sobre el amor y las relaciones y hace una disección de lo que nos han enseñado que es amar para cuestionarlo y que empieces a usar el corazón con más cabeza. Descubre por qué el amor no es como te lo han vendido. Comparamos nuestras relaciones con películas o vídeos perfectamente editados de Instagram. Idealizam...

    21,90 €