Procesamient o de Lenguaje Natural con Python: COMPUTADORAS
Por Ajit Singh
()
Información de este libro electrónico
Este libro tiene como objetivo presentar las técnicas fundamentales del procesamiento del lenguaje natural, desarrollar una comprensión de los límites de esas técnicas y de los temas de investigación actuales, y evaluar algunas aplicaciones actuales y potenciales.
● 1. Introducción. Breve historia de la investigación de la PNL, aplicaciones actuales, arquitectura genérica del sistema de la PNL, enfoques basados en el conocimiento versus enfoques probabilísticos.
●2. Técnicas de estados finitos. En morfología seccional y derivacional, autómatas de estado finito en PNL, transductores de estado finito.
●3. Predicción y etiquetado de partes del discurso. Corpora, DIY Corpus, Corpus Análisis, N-gramas simples, predicción de palabras, etiquetado estocástico y evaluación del rendimiento del sistema.
●4. Análisis y generación. Gramática generativa, gramáticas libres de contexto, parsing y generación con gramáticas libres de contexto, pesos y probabilidades. Gramática basada en restricciones, unificación, semántica compositiva simple. Relaciones semánticas.
●5. PNL con Python
Ajit Singh
Ajit Singh is equally interested in fiction and non-fiction and has written many books in English, Hindi, and Urdu. He has performed in Haryana, published his prose and verse in India and Pakistan, and participated in an international online poetry symposium organized by Bazm-e-Urdu, Qatar.He lives in a village, teaches science, and comes from a farming family. His father served as a major in the Parachute Regiment of the Indian Army.Ajit plays cricket, football, volleyball, basketball, badminton, and chess. He loves harmonium and flute, sings folk songs, and also enjoys gardening in his spare time. His nickname is "Badal," which means "cloud" in English.
Lee más de Ajit Singh
5G Simplemente en Profundidad Calificación: 0 de 5 estrellas0 calificacionesComputación Verde y Administración de la Energía Calificación: 0 de 5 estrellas0 calificacionesRealidad Virtual Calificación: 2 de 5 estrellas2/5Agile & Scrum Calificación: 0 de 5 estrellas0 calificaciones
Relacionado con Procesamient o de Lenguaje Natural con Python
Libros electrónicos relacionados
Introducción a los Algoritmos y las Estructuras de Datos 1: Introducción a los Algoritmos y las Estructuras de Datos, #1 Calificación: 0 de 5 estrellas0 calificacionesColecciones de datos y algoritmos en Python: de cero al infinito Calificación: 0 de 5 estrellas0 calificacionesIntroducción a los Algoritmos y las Estructuras de Datos, 1: Una base sólida para el mundo real del aprendizaje de máquinas y la estructura de datos Calificación: 0 de 5 estrellas0 calificacionesEstructuras de datos en java Calificación: 0 de 5 estrellas0 calificacionesIntroducción a los Algoritmos y las Estructuras de Datos 3: Introducción a los Algoritmos y las Estructuras de Datos, #3 Calificación: 0 de 5 estrellas0 calificacionesAprende Drupal 7. El mejor Framework-CMS Calificación: 0 de 5 estrellas0 calificacionesGestión Del Tiempo Y Ultra Productividad Total: Tus Decretos, #1 Calificación: 0 de 5 estrellas0 calificacionesLas Mejores 20 Ideas para Ganar Dinero en Internet Calificación: 0 de 5 estrellas0 calificacionesDesarrollo Web con CMS: Drupal 7 y Joomla 2.5 Calificación: 0 de 5 estrellas0 calificacionesDatos Informáticos Calificación: 0 de 5 estrellas0 calificacionesMatplotlib, Introducción a la Visualización 2D, Parte II Calificación: 0 de 5 estrellas0 calificacionesAprendizaje Automático En Acción: Un Libro Para El Lego, Guía Paso A Paso Para Los Novatos Calificación: 1 de 5 estrellas1/5Automatización de Tests de Software Con Selenium Calificación: 0 de 5 estrellas0 calificacionesDomina la lectura rápida: desata tu comprensión lectora Calificación: 0 de 5 estrellas0 calificacionesEstructura de datos: Un enfoque con Python, java y C++ Calificación: 0 de 5 estrellas0 calificacionesRealidad Aumentada: Que Es Y Como Cambiara Nuestra Vida Cotidiana: ConoCe Todos Los Usos Presentes Y Futuros De La Ra Y Como Impacta Al Mundo Calificación: 0 de 5 estrellas0 calificacionesCómo grabar audiolibros Calificación: 5 de 5 estrellas5/520 soles Calificación: 0 de 5 estrellas0 calificacionesDomina la oratoria y el debate: desata tu poder verbal Calificación: 0 de 5 estrellas0 calificacionesComputación en la nube 2ed Calificación: 0 de 5 estrellas0 calificacionesCómo Leer, Estudiar y Memorizar Rápidamente, de W.J. Mayo. Resumen Calificación: 0 de 5 estrellas0 calificacionesProgramación en Objetive-C con Xcode y GCC Calificación: 0 de 5 estrellas0 calificacionesFirebase: trabajar en la nube Calificación: 0 de 5 estrellas0 calificacionesCriptomoneda: Guía Para Principiantes Para Saber Invertir En Litecoin, Bitcoin Y Ethereum: Guía Para Principiantes Para Saber Invertir En Litecoin, Bitcoin Y Ethereum Calificación: 0 de 5 estrellas0 calificacionesLa mente renovada Calificación: 0 de 5 estrellas0 calificacionesProgramación en Go 2ed Calificación: 0 de 5 estrellas0 calificacionesDesarrollo de aplicaciones web con Jakarta EE Calificación: 0 de 5 estrellas0 calificacionesIntroducción a Android Studio. Incluye Proyectos Reales y el Código Fuente Calificación: 5 de 5 estrellas5/5Consejos Profesionales de Línea de Comando Bash Calificación: 5 de 5 estrellas5/5Aprende a Programar Swift Calificación: 0 de 5 estrellas0 calificaciones
Inteligencia (IA) y semántica para usted
Cómo usar Chatgpt para tu negocio Calificación: 0 de 5 estrellas0 calificacionesEl mito de la inteligencia artificial: Por qué las máquinas no pueden pensar como nosotros lo hacemos Calificación: 5 de 5 estrellas5/5Inteligencia artificial: Guía para seres pensantes Calificación: 0 de 5 estrellas0 calificacionesChat GPT-4 para Principiantes: Chat GPT, #1 Calificación: 0 de 5 estrellas0 calificacionesCómo Ganar Dinero por Internet con Inteligencia Artificial Emprende tu negocio digital con ChatGPT, Escríbelo.ia, Playground AI, You.com, Canva, Midjourney, Dall-E 2, Amazon... Calificación: 0 de 5 estrellas0 calificacionesEstructuras de Datos Básicas: Programación orientada a objetos con Java Calificación: 5 de 5 estrellas5/5¿Cómo piensan las máquinas?: Inteligencia artificial para humanos Calificación: 5 de 5 estrellas5/5Aprendizaje automático y profundo en python: Una mirada hacia la inteligencia artificial Calificación: 0 de 5 estrellas0 calificacionesDominando ChatGPT: Desbloquea el poder de la IA para mejorar la comunicación y las relaciones: Spanish Calificación: 3 de 5 estrellas3/5Fundamentos de Programación: Diagramas de flujo, Diagramas N-S, Pseudocódigo y Java Calificación: 0 de 5 estrellas0 calificacionesArquitectura de computadoras Calificación: 0 de 5 estrellas0 calificacionesEl poder de las imagenes, la palabra no tiene poder Calificación: 0 de 5 estrellas0 calificacionesGuíaBurros: Inteligencia Artificial: Su lado oscuro y el fin del principio Calificación: 0 de 5 estrellas0 calificacionesLaravel: Curso práctico de formación Calificación: 0 de 5 estrellas0 calificacionesDesarrollo de aplicaciones C#: con Visual Studio .NET Curso práctico Calificación: 0 de 5 estrellas0 calificacionesBusiness Intelligence: Técnicas herramientas y aplicaciones Calificación: 0 de 5 estrellas0 calificacionesMetodología de la Programación Orientada a Objetos Calificación: 0 de 5 estrellas0 calificacionesInteligencia artificial: Una exploración filosófica sobre el futuro de la mente y la conciencia Calificación: 4 de 5 estrellas4/5Escritura Creativa en la Era de la IA: Dominando la Colaboración con ChatGPT para Crear Libros Impactantes Calificación: 4 de 5 estrellas4/5Metodología de la programación Calificación: 0 de 5 estrellas0 calificacionesEl imperio de los algoritmos: IA inclusiva, ética y al servicio de la humanidad Calificación: 0 de 5 estrellas0 calificacionesInteligencia artificial: con aplicaciones a la ingeniería Calificación: 0 de 5 estrellas0 calificacionesSobreviviendo a la IA Calificación: 3 de 5 estrellas3/5Python fácil Calificación: 4 de 5 estrellas4/5Introducción a la ingeniería Calificación: 0 de 5 estrellas0 calificacionesResumen CHAT GPT IA Revolución en 2023: Guía de la Tecnología CHAT GPT y su Impacto Social: Resumen Tecnológico, #1 Calificación: 0 de 5 estrellas0 calificacionesANDROID: Aprende desde cero a crear aplicaciones Calificación: 0 de 5 estrellas0 calificacionesMáquinas como yo Calificación: 4 de 5 estrellas4/5
Comentarios para Procesamient o de Lenguaje Natural con Python
0 clasificaciones0 comentarios
Vista previa del libro
Procesamient o de Lenguaje Natural con Python - Ajit Singh
Contenido
Este libro tiene como objetivo presentar las técnicas fundamentales del
del lenguaje natural, desarrollar una comprensión de los límites de esas técnicas y de los temas de investigación actuales, y evaluar algunas aplicaciones actuales y potenciales.
1. Introducción. Breve historia de la investigación de la NLP, aplicaciones actuales, arquitectura genérica del sistema de la NLP, enfoques basados en el conocimiento versus enfoques probabilísticos.
2. Técnicas de estados finitos. En morfología seccional y derivacional, autómatas de estado finito en NLP, transductores de estado finito.
3. Predicción y etiquetado de partes del discurso. Corpora, DIY Corpus, Corpus Analysis, N-gramas simples, predicción de palabras, etiquetado estocástico y evaluación del rendimiento del sistema.
4. Análisis y generación. Gramática generativa, gramáticas libres de contexto, parsing y generación con gramáticas libres de contexto, pesos y probabilidades. Gramática basada en restricciones, unificación, semántica compositiva simple. Relaciones semánticas
5. NLP con Python
Derechos de autor © Ajit Singh 2022
Reservados todos los derechos. Ninguna parte de este trabajo puede reproducirse de ninguna forma ni por ningún medio sin el permiso por escrito del editor. Hago todo lo posible para respetar los derechos de autor.
Prefacio
La NLP es un campo amplio y multidisciplinario, por lo que este libro solo puede proporcionar una introducción muy general. El primer capítulo está diseñado para dar una visión general de las principales subáreas y una idea muy breve de las principales aplicaciones y las metodologías que se han empleado. La historia de la NLP se discute brevemente como una forma de poner esto en perspectiva. Los próximos tres capítulos describen algunas de las principales subáreas con más detalle. La organización se basa en una mayor profundidad
del procesamiento, comenzando con técnicas relativamente orientadas a la superficie y progresando hasta considerar el significado de las oraciones y los enunciados en contexto. Cada capítulo considerará la subárea como un todo y luego describirá uno o más algoritmos de muestra que abordan problemas particulares. Se han elegido los algoritmos porque son relativamente sencillos de describir y porque ilustran una técnica específica que ha demostrado ser útil, pero la idea es ejemplificar un enfoque, no dar una encuesta detallada (que sería imposible en el tiempo disponible). Sin embargo, a veces se discutirán brevemente otros enfoques. El capítulo final reúne el material anterior para describir el estado del arte en aplicaciones de muestra.
Objetivos:
El objetivo de mi libro para los estudiantes es:
1. ser capaz de describir la arquitectura y el diseño básico de un sistema de NLP genérico Caparazón
.
2. ser capaz de analizar el rendimiento actual y futuro probable de varias aplicaciones de NLP, como la traducción automática y la respuesta por correo electrónico.
3. ser capaz de describir brevemente una técnica fundamental para procesar el lenguaje para varias subtareas, como el análisis morfológico, el análisis sintáctico, la desambiguación del sentido de las palabras, etc.
4. Comprender cómo estas técnicas se basan y se relacionan con otras áreas de la informática (teórica), como la teoría del lenguaje formal, la semántica formal de los lenguajes de programación o la demostración de teoremas.
Características clave:
1. Discusión de los principales problemas involucrados en el procesamiento del lenguaje por medio de ejemplos tomados de aplicaciones de NLP con distinciones metodológicas y coloca las aplicaciones y la metodología en un contexto histórico.
2. Discusión de la morfología, concentrándose principalmente en la morfología inglesa. El concepto de un léxico en un sistema NLP se discute con respecto al procesamiento morfológico. Se introducen las reglas de ortografía y se explica el uso de transductores de estado finito para implementar reglas de ortografía.
3. Introduce algunas técnicas estadísticas simples e ilustra su uso en NLP para la predicción de palabras y categorías de partes del discurso. Comienza con una discusión de los corpus y luego introduce la predicción de palabras. La predicción de palabras puede verse como una forma de modelar (crudamente) cierta información sintáctica (es decir, el orden de las palabras).
4. NLP con Python
5. Cuerpo de bricolaje
Capítulo 1: Introducción a la PNL
Las personas se comunican de muchas maneras diferentes: hablando y escuchando, haciendo gestos, usando señales manuales especializadas (como cuando conducen o dirigiendo el tráfico), usando lenguaje de señas para sordos o a través de varias formas de texto. Por texto entendemos palabras que están escritas o impresas en una superficie plana (papel, tarjeta, letreros de calles, etc.) o que se muestran en una pantalla o dispositivo electrónico para que las lea su destinatario (o quienquiera que esté pasando). por).
Este curso se centrará solo en el último de ellos: nos ocuparemos de las diversas formas en que los sistemas informáticos pueden analizar e interpretar textos, y supondremos, por comodidad, que estos textos se presentan en formato electrónico. Esta es, por supuesto, una suposición bastante razonable, dada la enorme cantidad de texto a la que podemos acceder a través de la World Wide Web y la creciente disponibilidad de versiones electrónicas de periódicos, novelas, libros de texto y, de hecho, guías temáticas. Este capítulo presenta algunos conceptos, técnicas y terminología esenciales que se aplicarán en el resto del curso. Parte del material de este capítulo es un poco técnico, pero no hay programación involucrada en esta etapa.
Comenzaremos considerando los textos como cadenas de caracteres que pueden dividirse en subcadenas, e introduciremos algunas técnicas para describir informalmente patrones de varios tipos que ocurren en los textos. Posteriormente más adelante comenzaremos a motivar el análisis de los textos en términos de estructuras jerárquicas en las que se pueden incrustar elementos de diversa índole unos dentro de otros, de forma comparable a los elementos que componen un documento web HTML. Esta sección presenta algunos mecanismos técnicos como: máquinas de estado finito (FSMs), expresiones regulares, gramáticas regulares y gramáticas libres de contexto.
Conceptos básicos
Coincidencia de patrón y texto tokenizado
Una de las operaciones más básicas que se pueden aplicar a un texto es la tokenización: dividir un flujo de caracteres en palabras, signos de puntuación, números y otros elementos discretos. Entonces, por ejemplo, la cadena de caracteres
Dr. Watson, Sr. Sherlock Holmes
, dijo Stamford, presentándonos.
Se puede tokenizar como en el siguiente ejemplo, donde cada token está encerrado entre comillas simples:
`' `Dr.' 'Watson' ',' 'Sr.' 'Sherlock' 'Holmes' '
' ',' 'dijo' 'Stamford' ',' 'presentándonos' 'nosotros' '.
En este nivel, las palabras no han sido clasificadas en categorías gramaticales y tenemos muy poca indicación de la estructura sintáctica. Aún así, se puede obtener una buena cantidad de información a partir de un análisis relativamente superficial del texto tokenizado. Por ejemplo, supongamos que queremos desarrollar un procedimiento para encontrar todos los nombres de personas en un texto dado. Sabemos que los nombres personales siempre comienzan con mayúsculas, pero eso no es suficiente para distinguirlos de los nombres de países, ciudades, empresas, caballos de carreras, etc., o de las mayúsculas al comienzo de una oración. Algunas formas adicionales de identificar nombres personales incluyen:
Uso de un título Dr., Sr., Sra., Srta., Profesor, etc.
Una palabra o palabras en mayúsculas seguidas de una coma y un número, generalmente por debajo de 100: esta es una forma común de referirse a las personas en los informes de noticias, donde el número representa su edad, por ejemplo, Pierre Vinken, 61, . . .
Una palabra en mayúscula seguida de un verbo que generalmente se aplica a los humanos: dijo, informó, afirmó, pensó, argumentó. . . Esto puede generarse en exceso en el caso de nombres de países u organizaciones, como argumenta la Corona o afirma Gran Bretaña.
Podemos expresarlos de manera más concisa de la siguiente manera, donde j es el símbolo de disyunción, Word representa una palabra en mayúsculas e Int es un número entero:
(Dr. j Professor j Mr. j Mrs. j Miss j Ms) Word
Word Word, Int
Word (said j