Menú
Está libre
Registro
hogar  /  Educación/ Comparación de redes neuronales y lógica difusa. Métodos matemáticos y modelos de inteligencia artificial: lógica difusa, algoritmos genéticos, redes neuronales, etc.

Comparación de redes neuronales y lógica difusa. Métodos matemáticos y modelos de inteligencia artificial: lógica difusa, algoritmos genéticos, redes neuronales, etc.

Lógica difusa y redes neuronales

Introducción

Lógica difusa- una rama de las matemáticas, que es una generalización de la lógica clásica y la teoría de conjuntos, basada en el concepto de conjunto borroso, introducido por primera vez por Lotfi Zadeh en 1965 como un objeto con una función de pertenencia de un elemento a un conjunto que toma cualquier valor en el intervalo , y no solo 0 o 1. Sobre la base de este concepto, se introducen varias operaciones lógicas sobre conjuntos borrosos y se formula el concepto de variable lingüística, cuyos valores son conjuntos borrosos.

El tema de la lógica difusa es el estudio del razonamiento en condiciones de borrosidad, borrosidad, similar al razonamiento en el sentido habitual, y su aplicación en sistemas informáticos.

Direcciones de la investigación de la lógica difusa

Actualmente, existen al menos dos áreas principales de investigación en el campo de la lógica difusa:

Lógica difusa en sentido amplio (teoría de cálculos aproximados);

Lógica difusa en sentido estricto (lógica difusa simbólica).

Lógica difusa simbólica

La lógica difusa simbólica se basa en el concepto t-normas. Después de elegir una determinada t-norma (y puede introducirse de varias maneras diferentes), es posible definir las operaciones básicas sobre variables proposicionales: conjunción, disyunción, implicación, negación y otras.

Es fácil demostrar el teorema de que la distributividad presente en la lógica clásica se satisface solo en el caso de que se elija la t-norma de Gödel como t-norma.

Además, por ciertas razones, la operación llamada residium se elige con mayor frecuencia como una implicación (en términos generales, también depende de la elección de la t-norma).

La definición de las operaciones básicas enumeradas anteriormente conduce a una definición formal de la lógica difusa básica, que tiene mucho en común con la lógica clásica de valores booleanos (más precisamente, con el cálculo proposicional).

Hay tres lógicas difusas básicas principales: la lógica de Lukasiewicz, la lógica de Gödel y la lógica del producto. Curiosamente, la unión de dos cualquiera de las tres lógicas enumeradas anteriormente conduce a la lógica clásica de valores booleanos.

función característica

Para un espacio de razonamiento y una función de pertenencia dada conjunto borroso se define como

La función de pertenencia califica cuantitativamente la pertenencia de los elementos del conjunto fundamental del espacio de razonamiento al conjunto borroso. El valor significa que el elemento no está incluido en el conjunto borroso, describe el elemento totalmente incluido. Los valores entre y caracterizan los elementos incluidos difusos.

Conjunto borroso y clásico, nítido ( crujiente) un montón de

Ejemplos de conjuntos borrosos

1. Deja mi = {0, 1, 2, . . ., 10}, METRO =. El conjunto borroso "Varios" se puede definir de la siguiente manera:

"Varios" = 0,5/3 + 0,8/4 + 1/5 + 1/6 + 0,8/7 + 0,5/8; sus caracteristicas: altura = 1, transportador = {3, 4, 5, 6, 7, 8}, puntos de transición - {3, 8}.

2. Deja mi = {0, 1, 2, 3,…, norte,). El conjunto borroso "Pequeño" se puede definir:

3. Deja mi= (1, 2, 3, . . ., 100) y corresponde al concepto de "Edad", entonces el conjunto borroso "Joven" se puede definir usando

Fuzzy set "Young" en el set universal MI"= (IVANOV, PETROV, SIDOROV,...) viene dada por la función de pertenencia μ Joven ( X) sobre el mi =(1, 2, 3, . . ., 100) (edad), llamado en relación con MI" función de compatibilidad, mientras que:

dónde X- La edad de SIDOROV.

4. Deja mi\u003d (ZAPOROZHETS, ZHIGULI, MERCEDES, ...) es un conjunto de marcas de automóviles, y MI"= - conjunto universal "Coste", luego en MI" podemos definir conjuntos borrosos como:

Arroz. 1.1. Ejemplos de funciones de pertenencia

"Para los pobres", "Para la clase media", "Prestigiosa", con funciones de pertenencia como la Fig. 1.1.

Tener estas funciones y saber el costo de los autos de mi en un momento dado, por lo tanto determinamos en MI" conjuntos borrosos con los mismos nombres.

Así, por ejemplo, el conjunto borroso "Para los pobres", dado en el conjunto universal mi =(ZAPORIZHETZ, ZHIGULI, MERCEDES,...), se ve como se muestra en la fig. 1.2.

Arroz. 1.2. Un ejemplo de especificación de un conjunto borroso

Del mismo modo, puede definir el conjunto difuso "Alta velocidad", "Media", "Baja velocidad", etc.

5. Deja mi- conjunto de enteros:

mi= {-8, -5, -3, 0, 1, 2, 4, 6, 9}.

Entonces, un subconjunto borroso de números cercanos a cero en valor absoluto se puede definir, por ejemplo, de la siguiente manera:

un ={0/-8 + 0,5/-5 + 0,6/-3 +1/0 + 0,9/1 + 0,8/2 + 0,6/4 + 0,3/6 + 0/9}.

operaciones booleanas

Inclusión. Dejar PERO y A- conjuntos borrosos en el conjunto universal MI. Ellos dijeron eso PERO contenida en A, si

Designacion: PEROA.

A veces se utiliza el término dominación, aquellos. en caso de que PEROA, ellos dijeron eso A domina PERO.

Igualdad. A y B son iguales si

Designacion: A = B.

Suma. Dejar METRO = , PERO y A son conjuntos borrosos definidos en EA y A se complementan si

Designacion:

Es obvio que (adición definida para METRO= , pero es obvio que se puede definir para cualquier orden METRO).

intersección. PEROA es el subconjunto borroso más grande contenido simultáneamente en PERO y A:

Una asociación.AA es el subconjunto borroso más pequeño que incluye ambos PERO, asi que A, con función de pertenencia:

Diferencia. con función de pertenencia:

suma disjunta

PERO A = (AB) ∪ (LICENCIADO EN LETRAS) = (A̅ B) ∪ (̅A ⋂ B)

con función de pertenencia:

Ejemplos. Dejar

Aquí:

1) Un ⊂ A, es decir, A está contenido en B o B domina PERO DE incomparablemente ni con A, ni con A, aquellos. parejas ( A, C) y ( A, C) son pares de conjuntos borrosos no dominados.

2) ABC

3) ̅A = 0,6/X 1 + 0,8/X 2 + 1/X 3 + 0/X 4 ; ̅B = 0,3/X 1 + 0,1/X 2 + 0,9/X 3 +0/X 4 .

4) PEROB = 0,4/X 1 + 0,2/X 2 + 0/X 3 + 1 /X 4 .

5) AA= 0.7/x1+ 0,9/X 2 + 0,1/X 3 + 1/X 4 .

6) A-B= PERO̅B = 0,3/X 1 + 0,l/ X 2 + 0/X 3 + 0/X 4 ;

A- A= ̅AA= 0,6/X 1 + 0,8/X 2 + 0,l/ X 3 + 0/X 4 .

7) PEROB = 0,6/X 1 + 0,8/X 2 + 0,1/X 3 + 0/X 4 .

Representación visual de operaciones lógicas sobre conjuntos borrosos. Para conjuntos borrosos, puede crear una representación visual. Considere un sistema de coordenadas rectangulares, en cuyo eje y se trazan los valores μ PERO(X), los elementos están dispuestos en orden aleatorio en el eje de abscisas mi(ya hemos usado tal representación en los ejemplos de conjuntos borrosos). si un mi está ordenado por naturaleza, es deseable conservar este orden en la disposición de los elementos sobre el eje x. Tal representación hace que las operaciones lógicas simples en conjuntos borrosos sean visuales (ver Fig. 1.3).

Arroz. 1.3. Interpretación gráfica de operaciones lógicas:
α - conjunto borroso PERO; b- conjunto borroso ̅A, en - PEROPERO; GRAMO-APERO

En la fig. 1.3α la parte sombreada corresponde al conjunto borroso PERO y, para ser precisos, representa el rango PERO y todos los conjuntos difusos contenidos en PERO. En la fig. 1.3 b, c, g son dados un, unA,A tu PERO.

Propiedades de operación y

Dejar A B C son conjuntos borrosos, entonces se cumplen las siguientes propiedades:

A diferencia de los conjuntos nítidos, para conjuntos difusos en general

A ̅A ≠ ∅, A∪ ̅A ≠ E

(que, en particular, se ilustra arriba en el ejemplo de una representación visual de conjuntos borrosos).

Comentario . Las operaciones anteriores en conjuntos borrosos se basan en el uso de operaciones máximas y mínimas. En la teoría de conjuntos borrosos se desarrollan los problemas de construcción de operadores generalizados, parametrizados de intersección, unión y adición, que permiten tener en cuenta los diversos matices semánticos de los correspondientes conectivos “y”, “o”, “no”.


Normas Triangulares y Conormas

Un enfoque para los operadores de intersección y unión es definirlos en la clase de normas y conormas triangulares.

Norma triangular (t-norma) se llama una operación binaria (doble función real)

1. Limitado: .

2. Monotonía: .

3. Conmutatividad: .

4. Asociatividad: .

Ejemplos de normas triangulares

min( µ A ,µB)

trabajar µAµB

máx(0, µA+μ segundo - 1).

conor triangular(abreviado como conorma) es un real de dos lugares función

satisfaciendo las siguientes condiciones:

1. Limitado: .

2. Monotonía: .

3. Conmutatividad: .

4. Asociatividad: .

Conorma triangular es Arquímedes si es continuo
y para cualquier conjunto borroso realizado desigualdad .

Se llama estricta si función estrictamente decreciente en ambos argumentos.


Ejemplos de t-conorms

máx( µ A ,µB)

µA+ μ segundo - µA µB

min(1, µA+µB).

Ejemplos de conormos triangulares son los siguientes operadores:

norma triangular T y conor triangular S se llaman operaciones binarias complementarias si

T( a,b) + S(1 − a,1 − b) = 1

Los más populares en la teoría de Zadeh son tres pares de normas y conormas triangulares adicionales.

1) Intersección y unión por Zade:

TZ(a,b) = min( a,b}, S Z(a,b) = máx( a,b}.

2) Intersección y unión según Lukasiewicz:

3) Intersección y unión probabilística:

Operadores de complemento

En teoria conjuntos borrosos El operador complemento no es único.

Además del conocido

existe entero conjunto de operadores de complemento conjunto borroso.

Deja que algunos monitor

.

eso monitor será llamado el operador de negación en la teoría conjuntos borrosos si se cumplen las siguientes condiciones:

Si, además, se cumplen las siguientes condiciones:

(3) - estrictamente decreciente función

(4) - continuo función

entonces se llama negación estricta.

Función llamó negación fuerte o involución si, junto con las condiciones (1) y (2), se cumple lo siguiente:

(5) .

Aquí hay ejemplos de la función de negación:

Negación clásica: .

Negación cuadrática: .

La negación de Sugeno: .

Adición de tipo de umbral: .

Llamaremos a cualquier sentido, para cual , punto de equilibrio. Para cualquier negación continua, existe un único punto de equilibrio.

números borrosos

números borrosos- variables difusas definidas en el eje numérico, es decir un número borroso se define como un conjunto borroso PERO en el conjunto de números reales ℝ con función de pertenencia μ A(X) ϵ , donde X es un número real, es decir X ϵ ℝ.

número borroso Y esta bien si es máximo μ A(X) = 1; convexo si por alguna X a z realizado

μ A (x) μ A(a) ˄ µA(z).

Un montón de α - nivel de número borroso PERO definido como

= {X/μ α (X) ≥ α } .

Subconjunto SA⊂ ℝ se llama portador del número borroso PERO, si

SA = { x/μ A (x)> 0 }.

número borroso y unimodal si condición μ A(X) = 1 es válido solo para un punto del eje real.

número borroso convexo PERO llamó cero borroso, si

μ A (0) = cenar ( µA(X)).

número borroso y positivamente si ∀ Xϵ SA, x> 0 y negativo si ∀ X ϵ SA, x< 0.

Tipo de números borrosos (L-R)

Los números borrosos de tipo (L-R) son un tipo de números borrosos de un tipo especial, es decir establecer de acuerdo con ciertas reglas para reducir la cantidad de cálculos durante las operaciones en ellos.

Las funciones de pertenencia de los números borrosos de tipo (L-R) se especifican utilizando funciones de la variable real L( X) y R( X) satisfaciendo las propiedades:

a) L(- X) = L( X), R(- X) = R( X);

b) L(0) = R(0).

Obviamente, la clase de funciones (L-R) incluye funciones cuyas gráficas tienen la forma que se muestra en la Fig. 1.7.

Arroz. 1.7. Forma posible de funciones (L-R)

Ejemplos de especificación analítica de funciones (L-R) pueden ser

Sea L( a) y R( a)-funciones de tipo (L-R) (concreto). Número borroso unimodal PERO Con moda un(es decir. μ A(a) = 1) usando L( a) y R( a) se da de la siguiente manera:

donde a es la moda; α > 0, β > 0 - coeficientes de borrosidad izquierdo y derecho.

Así, dado L( a) y R( a) el número borroso (unimodal) viene dado por el triple PERO = (a, α, β ).

El número borroso tolerante viene dado, respectivamente, por los cuatro parámetros PERO = (a 1 , a 2 , α, β ), dónde a 1 y a 2 - límites de tolerancia, es decir en el intermedio [ a 1 , a 2 ] el valor de la función de pertenencia es igual a 1.

En la fig. 1.8.

Arroz. 1.8. Ejemplos de gráficas de funciones de pertenencia de tipo números borrosos (L-R)

Nótese que en situaciones específicas las funciones L (y), R (y), así como parámetros a, β números borrosos (a, α, β ) y ( a 1 , a 2 , α, β ) debe elegirse de tal forma que el resultado de una operación (suma, resta, división, etc.) sea exactamente o aproximadamente igual a un número borroso con el mismo L (y) y R (y), y parámetros α" y β" del resultado no fue más allá de las restricciones sobre estos parámetros para los números borrosos originales, especialmente si el resultado luego participará en operaciones.

Comentario. Resolver problemas de modelado matemático de sistemas complejos utilizando el aparato de conjuntos borrosos requiere realizar una gran cantidad de operaciones en varios tipos de variables lingüísticas y otras variables borrosas. Para la conveniencia de realizar operaciones, así como para la entrada-salida y el almacenamiento de datos, es deseable trabajar con funciones de membresía de forma estándar.

Los conjuntos borrosos que se tienen que operar en la mayoría de los problemas son, por regla general, unimodales y normales. Uno de los métodos posibles para aproximar conjuntos difusos unimodales es la aproximación mediante funciones de tipo (L-R).

En la Tabla se dan ejemplos de representaciones (L-R) de algunas variables lingüísticas. 1.2.

Tabla 1.2. Posible representación (L-R) de algunas variables lingüísticas

Relaciones borrosas

Relaciones borrosas juegan un papel fundamental en la teoría de los sistemas borrosos. Aparato de teoría relaciones borrosas utilizado en la construcción de la teoría de autómatas difusos, en el modelado de la estructura de sistemas complejos, en el análisis de procesos de toma de decisiones.

Definiciones basicas

Teoría relaciones borrosas encuentra también Apéndice en problemas en los que se aplica tradicionalmente la teoría de las relaciones ordinarias (claras). Por regla general, el aparato de la teoría de las relaciones claras se utiliza en el análisis cualitativo de las relaciones entre los objetos del sistema en estudio, cuando las relaciones son de naturaleza dicotómica y pueden interpretarse en términos de " conexión presente", " conexión desaparecidos", o cuando los métodos de análisis cuantitativo de las relaciones son inaplicables por alguna razón y las relaciones se reducen artificialmente a una forma dicotómica. conexión al look deseado. Sin embargo, este enfoque, que permite una evaluación cualitativa análisis sistemas conduce a la pérdida de información sobre la fuerza de las conexiones entre objetos o requiere cálculos en diferentes umbrales para la fuerza de las conexiones. Esta deficiencia carece de métodos de análisis de datos basados ​​en la teoría relaciones borrosas, que permiten una alta calidad análisis sistemas, teniendo en cuenta la diferencia en la fuerza de los vínculos entre los objetos del sistema.

normal borroso - relación aria definido como subconjunto producto cartesiano de conjuntos

como un conjunto borroso, relación borrosa se puede especificar utilizando su función de pertenencia

donde en el caso general supondremos que es un retículo distributivo completo. Por lo tanto, es un conjunto parcialmente ordenado en el que cualquier no vacío subconjunto tiene el inferior más grande y el superior más pequeño facetas y operaciones de intersección y uniones en satisfacer las leyes de distributividad. Todos operaciones arriba relaciones borrosas se definen usando estas operaciones de . Por ejemplo, si tomamos como un conjunto limitado de números reales, entonces las operaciones de intersección y unión en serán, respectivamente, operaciones y , y estos operaciones determinará y operaciones arriba relaciones borrosas.

si un conjuntos y final relación borrosa entre y se puede representar usándolo matrices de relación, cuya primera fila y primera columna tienen asignados elementos de los conjuntos y , y se coloca un elemento en la intersección de la fila y la columna (ver Tabla 2.1).

Tabla 2.1.
0,5 0,8
0,7 0,6 0,3
0,7 0,4

en caso de que conjuntos y partido, relación borrosa llamó relación difusa en el conjunto X.

En el caso de finito o numerable conjuntos universales obvio interpretación de relaciones difusas como gráfico ponderado, en el que cada par de vértices de está conectado por una arista con peso .

Ejemplo. Dejar y , luego borroso grafico se muestra en la figura. 2.1, especifica algunos relación borrosa .

Arroz. 2.1.

Propiedades de las relaciones borrosas

diferentes tipos relaciones borrosas se definen usando propiedades similares a las de las relaciones ordinarias, y para relaciones borrosas puede especificar diferentes formas de generalizar estas propiedades.

1. reflexividad:

2. reflexividad débil:

3. Fuerte reflexividad:

4. antirreflexividad:

5. antirreflexividad débil:

6. Fuerte anti-reflexividad:

7. Simetría:

8. antisimetría:

9. asimetría:

10. Fuerte linealidad:

11. Linealidad débil:

12. transitividad:

Proyecciones de relaciones borrosas

El concepto juega un papel importante en la teoría de los conjuntos borrosos. proyecciones de relaciones borrosas. vamos a dar definición proyecciones de una relación borrosa binaria.

Dejar - función de pertenencia de relación difusa en . proyecciones y relaciones en y - es conjuntos en y con función de pertenencia de la forma

Proyección condicional de relación difusa on , para un fijo arbitrario , es un conjunto con una función de pertenencia de la forma .

El condicional proyección en dado:

Esta definición muestra que las proyecciones y no afectan las proyecciones condicionales y , respectivamente. demos más definición que tiene en cuenta su relación.


Publicado en http:// www. sitio web. es/

MINISTERIO DE EDUCACIÓN Y CIENCIA DE RUSIA

PRESUPUESTO DEL ESTADO FEDERAL INSTITUCIÓN EDUCATIVA DE EDUCACIÓN SUPERIOR

"UNIVERSIDAD ESTATAL DE VORONEZH"

Facultad de Matemática Aplicada, Informática y Mecánica

trabajo de curso

38.03.05 Informática empresarial

en el curso "Lógica difusa y redes neuronales"

Vorónezh 2016

Capítulo 1

Capitulo 2

La primera parte del trabajo del curso es construir un pronóstico de precios para las acciones de "Mazut" con 5 días de anticipación.

La figura 1 muestra los datos que se utilizarán para el pronóstico: BAJO y CERRADO.

A continuación, debe ejecutar "Redes neuronales. En la pestaña "Rápido", seleccione el tipo de tarea: "Serie temporal". Luego, seleccione los datos de entrada y salida en la pestaña "Variables". En el trabajo del curso, construiremos un pronóstico para una variable "BAJO", será tanto una variable de entrada como de salida (Figura 2).

Luego seleccione el módulo "Solucionador inteligente de problemas", haga clic en "Aceptar" y en la ventana que se abre, configure los parámetros necesarios para la previsión.

En la pestaña “Rápido”, configuramos la cantidad de redes a entrenar (“Red probada”), en este ejemplo, se entrenarán 500 redes. En el parámetro "Red retenida", configure 10 redes. Aquí el programa seleccionará las 10 mejores redes. (Figura 3).

lógica difusa de predicción de precios

Seleccione la siguiente pestaña "Serie temporal" (Figura 4). Aquí establecemos el número de entradas para la predicción.

En la pestaña "Comentarios", seleccione lo siguiente: "Redes mejoradas (tiempo real)" y marque las casillas en los dos últimos parámetros. Esto se indica en la Figura 5.

En la pestaña "Tipos", seleccione el tipo de red que necesitamos. Construimos redes utilizando perceptrones multicapa (Figura 6). Los parámetros que necesitamos: "Perceptrón de tres capas" y "Perceptrón de cuatro capas"

Después de seleccionar todos los parámetros, presione el botón "OK". Después de identificar el proceso de construcción de redes, aparece una ventana, en la pestaña "Rápido", haga clic en el botón "Estadística descriptiva" (Figura 7).

La ventana que se abre muestra las características cuantitativas de las redes seleccionadas. Es necesario analizar los resultados obtenidos.

Lo que nos importa es el significado de la “S.D. relación"

Es más adecuado para propósitos de comparación porque es un número entre 1 y 0 y no depende del signo.

Después de analizar estos resultados, seleccionamos redes bajo los números: 1,2,3,4,5. (Figura 8)

En la pestaña "Gráficas" ("Gráficos") construimos gráficos de los 5 modelos seleccionados. Seleccionamos los gráficos más exitosos. El criterio de selección es la simetría. De las 5 redes seleccionadas, 2 redes (Figura 9) y 3 redes (Figura 10) satisfacen la condición de gráficos.

Luego seleccionamos 2 modelos nuevamente y en la ventana que se abre, en el parámetro "Duración de la proyección", establezca 5, y en el parámetro "Caso" (aquí selecciona el día desde el que comienza el pronóstico 310) Esto significa que el pronóstico se hará con 5 días de anticipación. Presione el botón "Hoja de cálculo de series temporales" (Figura 11).

Se abre una ventana que muestra los precios de las acciones desde el día 310 hasta el día 314 según el modelo de nuestras redes. Agregamos una nueva columna NewVar, donde copiamos los precios de nuestra tabla original (Figura 12).

Luego construimos gráficos para ver el pronóstico modelado por redes neuronales (Figura 14). Vemos que el grafo construido por una de las redes neuronales se ubica bastante cerca del original y repite aproximadamente sus cambios.

Sistema "Conjunto de programadores"

1. Datos de entrada

· Conocimiento de Inglés

·Habilidades computacionales

Muchas definiciones -

Conjunto de términos - (bajo, medio, alto)

· Experiencia laboral

Muchas definiciones -

Conjunto de términos - (pocos, suficientes, muchos)

Muchas definiciones -

Múltiples términos - (bajo, medio, alto, muy alto)


Documentos similares

    El concepto y propiedades de una variable lingüística, sus variedades. Fundamentos de la teoría del razonamiento aproximado. Sistemas de inferencia borrosa con una y varias variables de entrada. Principios de modelado borroso, cálculo de niveles de verdad.

    presentación, agregada el 29/10/2013

    El nacimiento de la inteligencia artificial. La historia del desarrollo de redes neuronales, programación evolutiva, lógica difusa. Algoritmos genéticos, su aplicación. Inteligencia artificial, redes neuronales, programación evolutiva y lógica difusa ahora.

    resumen, añadido el 22/01/2015

    Modelos para evaluar la solvencia de individuos en bancos rusos. Las redes neuronales como método para resolver el problema de clasificación. Descripción de las características del programa STATISTICA 8 Neural Networks. Características generales de las principales etapas del modelado de redes neuronales.

    tesis, agregada el 21/10/2013

    Tecnologías para la resolución de problemas utilizando redes neuronales en los paquetes de extensión Neural Networks Toolbox y Simulink. Creación de este tipo de red, análisis del escenario de formación y el grado de fiabilidad de los resultados de los cálculos sobre una matriz de prueba de vectores de entrada.

    trabajo de laboratorio, añadido el 20/05/2013

    Las principales etapas de los sistemas de inferencia borrosa. Reglas de producción difusa utilizadas en ellos. Enunciados lingüísticos confusos. Definición de algoritmos de Tsukamoto, Larsen, Sugeno. Implementación de la inferencia difusa de Mamdani en el ejemplo de un semáforo en la calle.

    documento final, agregado el 14/07/2012

    Métodos, sistemas, tipos y métodos de medidas en sistemas automatizados para la seguridad médica en el transporte. Diseño de un algoritmo difuso para exámenes médicos previos al viaje basado en una red adaptativa de inferencia neuro-difusa.

    tesis, agregada el 06/05/2011

    El concepto de redes neuronales y paralelos de la biología. Modelo artificial básico, propiedades y aplicación de redes. Clasificación, estructura y principios de funcionamiento, recopilación de datos para la red. Uso del paquete ST Neural Networks para reconocer variables significativas.

    resumen, añadido el 16/02/2015

    Resolviendo el problema de aproximación de superficies usando un sistema de inferencia borrosa. Definición de variables de entrada y salida, sus términos; Algoritmo de Sugeno. Selección de funciones de pertenencia, construyendo una base de reglas necesarias para conectar variables de entrada y salida.

    documento final, agregado el 31/05/2014

    Características de los modelos de aprendizaje. Información general sobre la neurona. Redes neuronales artificiales, perceptrón. Problema XOR y formas de resolverlo. Redes neuronales de retropropagación. Preparación de datos de entrada y salida. Redes neuronales de Hopfield y Hamming.

    prueba, agregada el 28/01/2011

    Un sistema intelectual es un sistema técnico o de software que resuelve problemas que se consideran creativos y pertenecen a un área temática específica. Análisis del sistema de inferencia borrosa. Familiaridad con el entorno de programación FuzzyTECH.

Mientras que los ingenieros en el campo del control automático han pasado de las tecnologías de control electromecánicas y analógicas tradicionales a los sistemas de control mecatrónicos digitales que integran análisis computarizados y algoritmos de decisión, nuevas tecnologías informáticas están en el horizonte que pueden causar cambios aún más significativos. Las redes neuronales y la lógica difusa ya han encontrado una amplia aplicación y pronto podrán cambiar la forma de construir y programar sistemas de control automático.

Las computadoras tradicionales tienen una arquitectura de von Neumann, que se basa en el procesamiento secuencial y la ejecución de instrucciones dadas explícitamente. Las redes neuronales artificiales (ANN) se construyen sobre la base de una arquitectura diferente. Se ensamblan a partir de unidades de procesador muy simples combinadas en un sistema con un alto nivel de paralelismo. Este sistema ejecuta comandos implícitos basados ​​en el reconocimiento de patrones en entradas de datos de fuentes externas.

La lógica difusa también le da la vuelta a las ideas tradicionales. En lugar de mediciones precisas que establecen la posición de una cantidad en una escala predeterminada (por ejemplo, “temperatura 23 °C”), la información borrosa indica el grado de pertenencia a conjuntos superpuestos vagamente definidos (“en el lado más frío de lo cálido”).

Definiciones

Las computadoras (o, más exactamente, las "máquinas de inferencia") que utilizan estos conceptos son capaces de resolver problemas complejos que los sistemas de control tradicionales no pueden manejar.

Una red neuronal artificial (ANN), según Wikipedia, es "una colección interconectada de 'neuronas' artificiales que utiliza un modelo matemático o computacional para procesar información basada en la conectividad de los cálculos".

En la mayoría de los casos, la ANN es un sistema adaptativo que cambia su estructura bajo la influencia de la información externa o interna que pasa a través de la red. En lugar de calcular resultados numéricos a partir de entradas numéricas, las ANN modelan relaciones complejas entre entradas y salidas, o descubren patrones en los datos.

Los nodos elementales (también llamados "neuronas", "neurods", "elementos de procesamiento" o "bloques") están conectados entre sí y forman una red de nodos. El efecto útil de su uso se deriva de la capacidad de implementar algoritmos de inferencia que cambian la fuerza o el peso de las conexiones de red para obtener el flujo de señal requerido.

En este ejemplo de red neuronal artificial, la variable h, que representa un vector 3D, depende de la variable de entrada x. Luego, g, una variable vectorial bidimensional, depende de h, y finalmente, la variable de salida f depende de g.

La más interesante es la posibilidad de aprendizaje, que en la práctica significa optimizar un cierto valor, a menudo llamado "costo", que muestra la corrección del resultado en el contexto del problema que se está resolviendo.

Por ejemplo, el precio en el problema clásico del viajante de comercio es el tiempo requerido para viajar por el territorio comercial completamente, deteniéndose en todos los puntos requeridos y llegando al punto de partida. Una ruta más corta da una mejor solución.

Para resolver este problema, las computadoras de von Neumann deben establecer todas las rutas posibles y luego verificar cada ruta por turno, sumando los retrasos de tiempo para determinar el retraso total de esta ruta.Después de calcular las sumas de todas las rutas posibles, la computadora simplemente elige la el más corto.

Por el contrario, las ANN consideran todas las rutas en paralelo para encontrar configuraciones que minimicen el tiempo total de la ruta. El uso de estas configuraciones minimiza la ruta resultante. El aprendizaje consiste en definir configuraciones que, en base a la experiencia previa, proporcionen estrategias de optimización de rutas.

La lógica difusa (nuevamente según Wikipedia) se deriva de la teoría de conjuntos borrosos que trata con un razonamiento que es más aproximado que preciso. La verdad en lógica difusa muestra la pertenencia a conjuntos definidos difusos. En la lógica difusa, las decisiones se pueden tomar en función de características vagamente definidas, pero no obstante muy importantes. La lógica difusa permite cambiar los valores de membresía en el rango de 0 a 1 inclusive, así como el uso de conceptos tan vagos como "un poco", "hasta cierto punto" y "mucho". Esto, de una manera especial, le permite implementar una membresía parcial en el conjunto.

La aplicación principal se puede describir mediante subrangos de una variable continua. Por ejemplo, el rango de temperatura de un sistema de frenos antibloqueo puede tener varias funciones de membresía separadas que determinan los rangos de temperatura necesarios para el control adecuado de los frenos. Cada función muestra si el valor de la temperatura pertenece al valor real en el rango de 0 a 1. Estos valores de verdad se pueden usar para seleccionar cómo se controlará el sistema de frenos.

Lógica difusa rápida para control en tiempo real

A pesar de que cualquier microcontrolador o computadora puede implementar algoritmos de lógica difusa en el software, esto puede ser ineficiente debido al bajo rendimiento y la necesidad de una gran cantidad de memoria. Jim Sibigtroth, ingeniero de sistemas automotrices para los microcontroladores del grupo de productos estándar y transporte de Freescale Semiconductor, dice que los microcontroladores HC12 y HCS12 de la compañía hacen esto de manera muy efectiva al agregar cuatro instrucciones diseñadas específicamente para implementar las partes centrales del motor de inferencia difusa.

"El programa principal del motor de inferencia universal que maneja reglas no ponderadas requiere aproximadamente 57 bytes de código objeto (aproximadamente 24 líneas de código ensamblador)", dice.

Sibigtroth señala que el modelo HCS12 de 25 MHz puede completar una secuencia de salida completa para dos entradas y una salida con siete etiquetas para cada entrada y salida en unos 20 µs. Un programa equivalente para el MC68HC11 de 8 MHz (sin comandos de lógica difusa) requeriría aproximadamente 250 bytes de código objeto y aproximadamente 750 µs de tiempo. Incluso si el MC68HC11 pudiera procesar el programa a la misma velocidad que el HCS12, las instrucciones de lógica difusa reducen el programa por un factor de 4 y reducen el tiempo de ejecución por un factor de 12. Estos cortos intervalos de reconocimiento permiten el uso de algoritmos de lógica difusa en sistemas de control en tiempo real sin equipos informáticos costosos ni programas grandes.

Procesamiento de imágenes

Con la ayuda de la toma de decisiones en ANN basada en lógica difusa, puede crear un poderoso sistema de control. Obviamente, estos dos conceptos funcionan bien juntos: un algoritmo de inferencia con tres estados borrosos (por ejemplo, frío, tibio, caliente) podría implementarse en hardware usando valores de verdad (0.8, 0.2, 0.0) como valores de entrada para las tres neuronas. , cada uno representando uno de tres conjuntos. Cada neurona procesa el valor de entrada de acuerdo con su función y recibe un valor de salida, que luego será el valor de entrada para la segunda capa de neuronas, y así sucesivamente.

Por ejemplo, una neurocomputadora para el procesamiento de imágenes puede eliminar numerosas restricciones en la grabación de video, la iluminación y la configuración del hardware. Este grado de libertad es posible debido al hecho de que la red neuronal le permite construir un mecanismo de reconocimiento mediante el examen de ejemplos. Como resultado, el sistema se puede entrenar para reconocer productos buenos y defectuosos con mucha o poca luz, cuando están ubicados en diferentes ángulos, etc. El motor de inferencia comienza por “evaluar” las condiciones de iluminación (es decir, establecer el grado de similitud con otras condiciones de iluminación bajo las que el sistema sabe actuar). Luego, el sistema toma una decisión sobre el contenido de la imagen utilizando criterios basados ​​en las condiciones de iluminación dadas. Debido a que el sistema trata las condiciones de iluminación como conceptos borrosos, el motor de inferencia determina fácilmente nuevas condiciones a partir de ejemplos conocidos.

Cuantos más ejemplos aprende el sistema, más experiencia gana el motor de procesamiento de imágenes. Este proceso de aprendizaje se puede automatizar con bastante facilidad, por ejemplo, clasificando previamente en grupos de partes con propiedades similares para aprender en áreas de similitudes y diferencias. Estas similitudes y diferencias observadas pueden proporcionar información a la ANN, cuya tarea es clasificar las piezas entrantes en estas categorías. Así, el éxito del sistema no depende del costo del equipo, sino de la cantidad de imágenes requeridas para entrenar y construir un motor de inferencia confiable.

Una neurocomputadora de imágenes es adecuada para aplicaciones en las que el diagnóstico se basa en la experiencia y los conocimientos del operador en lugar de modelos y algoritmos. El procesador puede construir un mecanismo de reconocimiento a partir de simples comentarios sobre la imagen hechos por el operador, luego extraer características o vectores de características de los objetos proporcionados con comentarios y pasarlos a la red neuronal. Los vectores de características que describen objetos visibles pueden ser tan simples como valores de fila de píxeles, un histograma o distribución de intensidad, perfiles de distribución de intensidad o gradientes a lo largo de los ejes respectivos. Características más complejas pueden incluir elementos de la transformada wavelet y la transformada rápida de Fourier.

generalizaciones

Después de aprender de ejemplos, la red neuronal es capaz de generalizar y puede clasificar situaciones que nunca antes se han observado, asociándolas con situaciones similares de ejemplos. Por otro lado, si el sistema es propenso a una excesiva libertad y generalización de situaciones, su comportamiento puede corregirse en cualquier momento mediante el aprendizaje de contraejemplos.

Desde el punto de vista de la red neuronal, esta operación consiste en reducir las áreas de influencia de las neuronas existentes para que coincidan con nuevos ejemplos que están en conflicto con el mapeo existente del espacio de decisión.

Un factor importante para determinar la aceptación de las RNA es el aprendizaje independiente y adaptativo. Esto significa que el dispositivo debe poder estudiar el objeto con una intervención mínima o nula del operador. En el futuro, por ejemplo, las muñecas podrían reconocer la cara de un niño que las desenrolla por primera vez y preguntar su nombre. El autoaprendizaje de un celular podría ser estudiar la huella dactilar de su primer dueño. La identificación del propietario también se puede mejorar combinando el reconocimiento facial, de huellas dactilares y de voz en un solo dispositivo.

En un entorno de autoaprendizaje, un dispositivo debe construir su propio motor de reconocimiento que funcione mejor en su entorno de trabajo. Por ejemplo, una muñeca inteligente debe reconocer a su dueño original sin importar el color de su cabello y piel, la ubicación o la estación del año.

Al principio, el motor debe usar todas las técnicas de extracción de características que conoce. Esto conducirá a la formación de una serie de mecanismos intermedios, cada uno de los cuales está diseñado para identificar las mismas categorías de objetos, pero basándose en la observación de diferentes características (color, granulosidad, contraste, grosor de los bordes, etc.). El motor general puede entonces evaluar el rendimiento de los motores intermedios, eligiendo aquellos que ofrecen el mejor rendimiento y/o precisión.

Ejemplo de clasificación de pescado

PiscesVMK fabrica equipos de procesamiento para el procesamiento de pescado a bordo y en fábricas costeras. Los clientes de la empresa son barcos procesadores de pescado que pescan varios tipos de pescado durante todo el año en el Mar del Norte y el Océano Atlántico. Estos consumidores quieren llenar sus bodegas lo más rápido posible con capturas de la más alta calidad con el mínimo número de trabajadores.

Por lo general, el pescado se sube a bordo con redes y se descarga en contenedores en una cinta transportadora que los transporta a través de máquinas de limpieza, rebanado y fileteado. Las posibles desviaciones incluyen la variedad incorrecta, pescado dañado, tener más de un pescado en el tanque y no colocarlo correctamente antes de ingresar a la máquina rebanadora. La implementación de dicho control por los medios tradicionales de procesamiento de imágenes es difícil, ya que las dimensiones, la forma y el volumen son difíciles de describir matemáticamente. Además, estos parámetros pueden variar según el lugar de navegación y la temporada.

Pisces ha instalado más de 20 sistemas basados ​​en la cámara inteligente Iris de Matrox y el motor de reconocimiento CogniSight de General Vision. La cámara se monta encima del transportador para que el pescado pase por debajo justo antes de entrar en la fileteadora. La cámara está conectada a un controlador Siemens Simatic S7-224 (PLC) ya una red de área local (LAN). Una fuente de luz estroboscópica montada junto a la cámara se dispara cada vez que aparece un nuevo contenedor. Es necesario conectar la cámara a la red local para realizar tres operaciones: ajustar el transductor para garantizar el enfoque y el contraste adecuado de la imagen, aprender el motor de reconocimiento y acceder a las estadísticas que informan continuamente la cantidad de peces acondicionados y en mal estado.

El ajuste del transductor ocurre solo una vez durante la instalación de la cámara en una carcasa resistente al agua. El entrenamiento se realiza al comienzo de cada nado con muestras de peces de la primera captura o cargando un archivo existente.

Una vez que la cámara recibe la base de conocimientos, puede comenzar a reconocer peces de forma autónoma, sin estar conectada a una PC. El INS lo clasifica en las categorías "aceptado", "rechazado", "para trámite" o "vacío". Esta señal va a un PLC que controla dos cepillos que dirigen el pescado adecuado a los contenedores para su eliminación o procesamiento. El PLC también está conectado a un sensor magnético que genera una señal de disparo cada vez que un contenedor de pescado pasa por debajo de la cámara.

Piscis ahora ha instalado más de 20 sistemas en 5 flotas pesqueras diferentes en Noruega, Islandia, Escocia y Dinamarca. El sistema estima 360 capacidades de transportador por minuto en las líneas de arenque, pero puede funcionar incluso más rápido.

Para una red de 80 neuronas, se logró un 98% de precisión en la clasificación de 16 toneladas de pescado. Los pescadores están satisfechos con el sistema debido a su fiabilidad, flexibilidad y facilidad de uso. Beneficios: Reducción del tiempo de navegación, mayor calidad de la captura e ingresos compartidos entre menos pescadores.

En herramientas de fabricación discretas, las redes neuronales han encontrado aplicación en el control de vehículos, reconocimiento de patrones en sistemas de radar, reconocimiento de personalidad, reconocimiento de objetos, escritura a mano, gestos y habla.

La lógica difusa ya se está utilizando para controlar el automóvil y otros subsistemas del vehículo, como el ABS y el control de crucero, así como el aire acondicionado, las cámaras, las imágenes digitales, la IA de los juegos de computadora y el reconocimiento de patrones en los sistemas de sensores remotos.

También se están utilizando tecnologías de "computación suave" similares para crear cargadores confiables para baterías de aparatos de respiración. En las industrias continua y por lotes, la lógica difusa y las redes neuronales son la base de algunos controladores autoajustables. Algunos microcontroladores y microprocesadores están optimizados para lógica difusa para que los sistemas puedan funcionar aún más rápido (consulte "Lógica difusa rápida para control en tiempo real" a continuación).










Ejemplo "Té caliente" X \u003d 0 C C; C \u003d 0/0; 0/10; 0/20; 0.15/30; 0.30/40; 0.60/50; 0.80/60; 0, 90/70; 1/ 80; 1/90; 1/100.


Intersección de dos conjuntos borrosos ("Y" borrosos): MF AB (x)=min(MF A (x), MF B (x)). Unión de dos conjuntos borrosos ("OR" borrosos): MF AB (x)=max(MF A (x), MF B (x)).


Según Lotfi Zade, una variable lingüística es una variable cuyos valores son palabras u oraciones de un lenguaje natural o artificial. Los valores de una variable lingüística pueden ser variables difusas, es decir la variable lingüística está en un nivel más alto que la variable difusa.


Cada variable lingüística consta de: un nombre; el conjunto de sus valores, que también se denomina conjunto de términos base T. Los elementos del conjunto de términos base son los nombres de las variables difusas; conjunto universal X; una regla sintáctica G, según la cual se generan nuevos términos utilizando palabras de un lenguaje natural o formal; regla semántica P, que asocia cada valor de una variable lingüística con un subconjunto borroso del conjunto X.










Descripción de la variable lingüística "Precio de la acción" X= Conjunto de términos base: "Bajo", "Moderado", "Alto"


Descripción de la variable lingüística "Edad"








"Soft computing" (Soft computing) lógica difusa, redes neuronales artificiales, razonamiento probabilístico, algoritmos evolutivos


























Construir la red (después de seleccionar las variables de entrada) Seleccionar la configuración de red inicial Realizar una serie de experimentos con diferentes configuraciones, recordando la mejor red (en el sentido del error de control). Para cada configuración, se deben realizar varios experimentos. Si se observa un ajuste insuficiente en el siguiente experimento (la red no produce un resultado de calidad aceptable), intente agregar neuronas adicionales a la (s) capa (s) intermedia (s). Si eso no ayuda, intente agregar una nueva capa intermedia. Si hay sobreajuste (el error de control comenzó a crecer), intente eliminar algunos elementos ocultos (y posiblemente capas).


Problemas de Minería de Datos Resueltos con Redes Neuronales Clasificación (Aprendizaje Supervisado) Clustering de Predicción (Aprendizaje No Supervisado) Reconocimiento de Texto, Reconocimiento de Voz, Identificación de Personalidad encontrar la mejor aproximación de una función dada por un conjunto finito de valores de entrada (ejemplos de entrenamiento la tarea de comprimir información al reducir la dimensión de los datos


¿La tarea "Emitir un préstamo a un cliente" en el paquete analítico Deductor (BaseGroup)? – Apartamento, – Área del apartamento. Es necesario construir un modelo que sea capaz de responder si el Cliente que quiere recibir un préstamo se encuentra en el grupo de riesgo de impago del préstamo, es decir. el usuario debe recibir una respuesta a la pregunta "¿Debo emitir un préstamo?" La tarea pertenece al grupo de tareas de clasificación, es decir aprendiendo con un maestro.







sistemas de lógica difusa) pueden operar con información cualitativa inexacta y explicar las decisiones tomadas, pero no son capaces de aprender automáticamente las reglas para su derivación. Como consecuencia, su cooperación con otros sistemas de procesamiento de información es muy deseable para superar esta deficiencia. Dichos sistemas ahora se usan activamente en varios campos, como control de procesos, ingeniería, operaciones financieras, evaluación de solvencia, diagnósticos médicos, etc. Las redes neuronales se usan aquí para ajustar las funciones de membresía de los sistemas de toma de decisiones difusas. Esta capacidad es especialmente importante para resolver problemas económicos y financieros, ya que, debido a su naturaleza dinámica, las funciones de los miembros deben adaptarse inevitablemente a las condiciones cambiantes.

Si bien la lógica difusa se puede usar explícitamente para representar el conocimiento experto con reglas para variables lingüísticas, suele llevar mucho tiempo construir y ajustar las funciones de pertenencia que cuantifican estas variables. Los métodos de entrenamiento de redes neuronales automatizan este proceso y reducen significativamente el tiempo y los costos de desarrollo, al tiempo que mejoran los parámetros del sistema. Los sistemas que utilizan redes neuronales para determinar los parámetros de los modelos borrosos se denominan sistemas borrosos neuronales. La propiedad más importante de estos sistemas es su interpretabilidad en términos de reglas difusas si-entonces.

Dichos sistemas también se denominan sistemas difusos neuronales cooperativos y se oponen a los sistemas difusos neuronales competitivos en los que las redes neuronales y los sistemas difusos trabajan juntos para resolver el mismo problema sin interactuar entre sí. En este caso, una red neuronal se suele utilizar para el preprocesamiento de entradas o para el posprocesamiento de salidas de un sistema difuso.

Además de ellos, también existen sistemas neuronales difusos. Este es el nombre de las redes neuronales que utilizan métodos difusos para acelerar el aprendizaje y mejorar su rendimiento. Esto se puede lograr, por ejemplo, utilizando reglas difusas para cambiar la tasa de aprendizaje o considerando redes neuronales con valores de entrada difusos.

Hay dos enfoques principales para controlar la tasa de aprendizaje del perceptrón método de retropropagación. En el primer caso, esta tasa disminuye de manera simultánea y uniforme para todas las neuronas de la red, dependiendo de un criterio global: el error cuadrático medio logrado en la capa de salida. Al mismo tiempo, la red aprende rápidamente en la etapa inicial de entrenamiento y evita oscilaciones de error en la etapa posterior. En el segundo caso, se evalúan los cambios en las conexiones interneuronales individuales. Si en los siguientes dos pasos de aprendizaje los incrementos de conexiones tienen signo contrario, entonces es razonable reducir la tarifa local correspondiente, de lo contrario, se debe aumentar. El uso de reglas difusas puede proporcionar un control más preciso de la tasa local de modificación del enlace. En particular, esto se puede lograr si se utilizan valores sucesivos de los gradientes de error como parámetros de entrada a estas reglas. La tabla de reglas correspondientes podría verse así:

Tabla 11.4. Regla difusa para adaptar la tasa de aprendizaje de una red neuronal
gradiente anterior gradiente actual
nótese bien NS Z PD PB
nótese bien PB PD Z NS nótese bien
NS NS PD Z NS nótese bien
Z nótese bien NS Z NS nótese bien
PD nótese bien NS Z PD NS
PB nótese bien NS Z PD PB

Las variables lingüísticas Tasa de aprendizaje y Gradiente toman los siguientes valores en la regla de adaptación difusa ilustrada por la tabla: NB - negativo grande; NS - pequeño negativo; Z - cerca de cero; PS - pequeño positivo; PB - gran positivo.

Finalmente, en los sistemas difusos neuronales híbridos modernos, las redes neuronales y los modelos difusos se combinan en una única arquitectura homogénea. Dichos sistemas pueden interpretarse como redes neuronales con parámetros difusos o como sistemas difusos distribuidos en paralelo.

Elementos de lógica difusa

El concepto central de la lógica difusa es el concepto variable lingüística. Según Lotfi Zade, una variable lingüística es una variable cuyos valores son palabras u oraciones de un lenguaje natural o artificial. Un ejemplo de variable lingüística es, por ejemplo, una disminución en la producción si toma valores lingüísticos, como despreciable, notable, significativo y catastrófico, por ejemplo. Es obvio que los significados lingüísticos no caracterizan claramente la situación existente. Por ejemplo, una caída del 3% en la producción puede verse como algo insignificante y algo notable. Es intuitivamente claro que la medida de que una caída dada es catastrófica debe ser bastante pequeña.