Hilbert y Gödel: Perspectivas Matemáticas

Carlos Torres Alcaraz HILBERT Y GÖDEL: dos perspectivas de la matemática Facultad de Ciencias, UNAM 2018 Torres Alcaraz, Carlos, autor. Hilbert y Gödel : dos perspectivas de la matemática / Carlos Torres Alcaraz. -- 1ª edición. –- Ciudad de México : Universidad Nacional Autónoma de México, Facultad de Ciencias, 2018. xxx, 518 páginas : ilustraciones ; 22 cm. -– (Temas de matemáticas) Incluye índice Bibliografía: páginas 491-512 ISBN 978-607-30-0919-5 1.Gödel, Kurt. 2. Hilbert, David, 1862-1943. 3. Geometría— Fundamentos. 4. Matemáticas—Filosofía. 5. Lógica simbólica y matemática. I. Universidad Nacional Autónoma de México. Facultad de Ciencias. II. Título. 516.2-scdd22 Biblioteca Nacional de México Esta obra contó con el apoyo del proyecto PAPIME PE-103916 Hilbert y Gödel: dos perspectivas de la matemática 1a edición, 28 de agosto de 2018 © DR. 2018. Universidad Nacional Autónoma de México. Facultad de Ciencias Ciudad Universitaria, Delegación Coyoacán. C.P. 04510. Ciudad de México editoriales@ciencias.unam.mx tienda.fciencias.unam.mx ISBN: 978-607-30-0919-5 Diseño de portada: Laura Uribe y Eliete Martín del Campo Prohibida la reproducción total o parcial de la obra, por cualquier medio, sin la autorización por escrito del titular de los derechos. Impreso y hecho en México. Preámbulo Una explicación nada literaria que, además, no explica nada Hay un cuento de Augusto Monterroso que nunca dejará de sorprenderme. Supongo que no tiene nombre, pues si lo tuviera, éste sería más largo que él. Cabe en medio renglón: Cuando despertó, el dinosaurio todavía estaba allí.1 No sé si esta narración habrá dejado satisfecho al señor Monterroso, o si pensaba reducirla todavía más, pero eso no importa: como está, lo dice todo sin decir nada a la vez: ¿Quién despertó?, ¿por qué durmió?, ¿qué representa el dinosaurio?, ¿llegamos tarde al relato y sólo escuchamos la parte final?, ¿a qué extraña historia pone punto final tal acotación? Pensando en todas estas interrogantes, y en busca de una inexistente explicación del cuento-oración, llegué a dos conclusiones: 1) que el autor nos deja en libertad de poner todo lo que imaginamos que calla, y 2) que una indiscutible lectura es la siguiente: un individuo, asediado y sin saber cómo escapar de su desventura, echó a dormir con la esperanza de que al despertar la causa de su infortunio hubiera desaparecido. Como entonces yo escribía este trabajo, pensé que el personaje sería Hilbert y el dinosaurio los teoremas de Gödel, e hice con estos protagonistas una variante nada literaria y totalmente personalizada del cuento (por lo que de antemano pido una disculpa al señor Monterroso): Cuando despertó, los teoremas de Gödel todavía estaban allí. Esta libre traslación del relato me agrada no porque sea buena literatura, sino porque me permite llegar sin más explicaciones al nudo gordiano de este trabajo: al derrumbe de un proyecto de naturaleza dual, mitad matemáticas, mitad filosofía. Y como aquí de lo que se trata es de un trabajo académico y no de literatura, ahora debo explicar qué fue lo que sucedió antes del “Cuando” y después del “Cuando”, es decir, porqué en mi fantasía Hilbert decidió dormir para ver si así desaparecía el dinosaurio, y porqué deseaba su desaparición. Esto, obviamente, en cientos de páginas y no en media línea, como el prodigioso Sr. Monterroso lo podría haber hecho. 1 Para mi asombro, después de escribir estas líneas me enteré de que el cuento sí tiene nombre, y que es más corto que él. Se llama El dinosaurio. Esto es, al menos, lo que una culta dama me dijo. I Prefacio Para empezar, una ecuación: matemática = matemáticas.2 Sin lugar a dudas, David Hilbert y Kurt Gödel se cuentan entre los matemáticos más prominentes de la era moderna, y ello por dos razones: primero, por la profundidad y amplitud de sus contribuciones a las matemáticas; segundo, por su labor en el ámbito de los fundamentos y la filosofía de las matemáticas. En el imaginario colectivo, Hilbert ha pasado a la historia como el padre del formalismo matemático (sin importar lo que esto último signifique), y en la lógica y la filosofía como el creador de un ambicioso programa tendiente a “eliminar en forma definitiva el problema de los fundamentos de las matemáticas”. Por su parte Gödel debe su fama a dos teoremas de su autoría, calificados como “las verdades matemáticas más significativas del siglo veinte”3 , con la particularidad de que con ellos puso fin a las pretensiones de Hilbert. También hay que añadir a sus méritos la imagen que nos ofrece de la matemática, en la que en lugar de una ciencia contenida en rígidos formalismos (como lo procuraba Hilbert), nos presenta una ciencia abierta, incompleta e incompletable, y por añadidura incapaz de justificar su propia coherencia interna. Esto, que pareciera una breve descripción de la grandeza de Hilbert y Gödel y de sus discordancias, en realidad encierra una multitud de acontecimientos, muchos de los cuales datan del siglo XIX. Esconde, por ejemplo, la fructífera labor de Hilbert en torno a los fundamentos, primero de la geometría y después de la aritmética, el análisis y la teoría de conjuntos, y que se extendió por más de 38 años. Encubre también el derrumbe de la visión clásica de la matemática, la aparición de nuevos métodos y procedimientos que transformaron su entraña, la elaboración de un nuevo fundamento para el análisis matemático (no exento de problemas), el surgimiento de nuevas teorías matemáticas cada vez más complejas y abstractas (v. gr., la teoría de los números transfinitos de Cantor y el álgebra moderna), y la aparición de nuevas geometrías que 2 En otras palabras, el sustantivo con que designamos a la ciencia matemática puede emplearse indistintamente en singular o en plural. Eso ocurre en este texto, donde incluso dichas expresiones se alternan en un mismo párrafo u oración. Esta postura está avalada por el diccionario de la RAE, cuando en el inciso 5 de la entrada “matemático” dice que el término se utiliza en plural con el mismo significado que en singular. 3 Las palabras son de Willard van Orman Quine, aunque él lo dice en singular (“el teorema de Gödel”). III P REFACIO IV cuestionaron el papel de la geometría clásica euclidiana.4 Oculta también la irrupción de paradojas en la teoría de conjuntos y el inicio de un vigoroso debate en torno a la naturaleza y los fundamentos de las matemáticas en el que se perfilaron al menos tres escuelas discordantes. Nuestro propósito es construir un relato sobre la labor de Hilbert y Gödel en este terreno, mas no en forma aislada, sino en el más amplio contexto de los sucesos recién señalados. En particular, queremos seguir la evolución de las ideas de Hilbert desde antes de la publicación de su libro Fundamentos de la geometría de 1899, hasta la propuesta de un nuevo fundamento para la matemática clásica en los años veinte. Deseamos examinar cómo dio forma a su programa de fundamentación en sus dos vertientes, la filosófica y la matemática, y seguir su línea de pensamiento exhibiendo cómo fue que amplió sus metas (v. gr., procurar una teoría formal completa para la aritmética y despejar las dudas respecto a la resolubilidad de todo problema matemático) y cómo llegó a la idea de que el cálculo lógico propuesto en el programa codifica nuestras técnicas de pensamiento, es decir, compendia las reglas conforme a las cuales procede nuestro pensamiento cuando hacemos matemáticas. Todo esto teniendo como telón de fondo los acontecimientos y debates ya referidos. Logrado lo anterior podremos apreciar la verdadera dimensión de lo hecho por Gödel, comprender lo que todo ello significó para Hilbert, y ponderar la manera en que cada uno de ellos entendió las matemáticas.5 La escritura de un libro de tal extensión debe tener una clara justificación. Ofrezco algunas razones. La primera es muy simple y no requiere de mayores argumentos: la labor de Hilbert en torno a los fundamentos de la matemática tuvo una enorme influencia en la matemática del siglo XX, especialmente en el modo de entenderla. Para el caso podemos citar dos ejemplos: (1) el peso que tuvo en la adopción del método axiomático, el cual se ha extendido a muchas ramas de la matemática; (2) la idea que nos transmitió de la matemática pura, en la que vio una ciencia abstracta sin la obligación de tratar con “las cosas de este mundo”. Abrir camino a esta manera de ver nuestra ciencia, tan común en la actualidad, fue una tarea en la que Hilbert se 4 Hasta bien entrado el siglo XIX la geometría (euclidiana) era considerada una de las ramas más firmes del conocimiento humano. Sin más, se trataba del estudio de las propiedades del espacio, las cuales se manifestaban como verdades objetivas, universalmente válidas para la mente humana. Como sabemos, esta concepción decayó paulatinamente tras la aparición de las geometrías no euclidianas. Al respecto, éste no fue sino uno de los acontecimientos que condujeron al deterioro de las ideas que tradicionalmente se habían admitido acerca de las matemáticas y a las que Kant había dado un firme sustento a finales del siglo XVIII. 5 En el fondo me animaba la idea, no lograda en virtud de la vastedad del propósito, de recorrer el camino que siguiera la ciencia moderna en el siglo veinte, el que va de la certeza a la incertidumbre, siguiendo esta vez el pensamiento de Hilbert y Gödel. En este sentido no deja de sorprenderme el hecho de que Hilbert, siendo un defensor de las nuevas ideas matemáticas y mentor de Max Born, uno de los creadores de la mecánica cuántica, siguiera viendo a la matemática en los términos del viejo racionalismo, según el cual la razón tiene la capacidad de establecer, en todos los casos (aquí se trata de la matemática), principios que determinan en su totalidad las relaciones entre los entes de un campo determinado (v. gr., la aritmética, la teoría de conjuntos). V comprometió, debiendo enfrentar una tenaz oposición. Tenemos, además, la innegable presencia de Hilbert y Gödel en la filosofía contemporánea de las matemáticas.6 Una segunda razón, igual de importante, es que en mi labor como profesor de lógica matemática en la Facultad de Ciencias, y como profesor de filosofía de las matemáticas en diversos lugares (Licenciatura en Matemáticas, Posgrado en Filosofía de la Ciencia, Maestría en Docencia para la Educación Media Superior, diplomados y demás) me di cuenta de la necesidad de un texto, escrito con intenciones didácticas, que ofreciera una visión panorámica de los temas ya referidos. Tal libro estaría dirigido no a los especialistas en la materia (para quienes ya hay una extensa literatura), sino a quienes desean aprender de ella sin antes haber cubierto todos los temas que los expertos marcan como necesarios para su comprensión. Además un libro amigable, accesible a todo aquél que, con una razonable formación matemática, desee acercarse a tales cuestiones. En breve: Un texto que, de manera simple, explique los elementos básicos del trabajo de Hilbert y Gödel en torno a los fundamentos de las matemáticas, tomando en cuenta el contexto en que se produjo y que influyó evidentemente en su desarrollo. Es un hecho afortunado que hoy en día la bibliografía relativa a estas cuestiones es muy extensa. Son numerosos los libros y artículos que examinan en detalle todos y cada uno de los aspectos de la obra de Hilbert y Gödel. No obstante, por distintas razones ninguno de ellos reúne todas las bondades que esperamos. En algunos casos se trata de trabajos especializados dirigidos a quienes, conociendo ya la obra de Hilbert y Gödel, buscan profundizar en alguna cuestión en particular (lo cual no es posible en una primera aproximación);7 otros consisten en antologías que reúnen textos relativos a un tema en particular o publicados en un periodo determinado,8 muchos de los cuales dejan al lector la tarea de construir un discurso en torno a ellos. Otros más sólo tocan aspectos técnicos del trabajo de Hilbert y Gödel, sin hacer referencia al contexto histórico o filosófico, o se concentran en cuestiones meramente biográficas o anecdóticas, sin ir al fondo de los problemas. Esto por mencionar algunos ejemplos. Un caso aparte lo forman aquellas investigaciones en las que las cosas se miran desde la perspectiva de los problemas filosóficos tradicionales (metafísica, epistemología, 6 Digamos que el estudio de su obra nos brinda una mejor perspectiva del carácter de la matemática actual. Por ejemplo, retomando el tema ya mencionado en la nota al pie precedente, si el lector piensa que por pura reflexión, acompañada quizá por algunas consideraciones intuitivas, es posible descubrir un conjunto de principios que comprendan todas las verdades de la aritmética, o, peor aún, un sistema filosófico que contenga de manera absoluta toda la verdad acerca de la existencia humana, le suplicamos encarecidamente que lea este importuno texto y reflexione sobre dicha aspiración, hasta convencerse de que no es más que un candoroso sueño de la razón que debemos tirar al cesto de la basura. Para eso y algo más nos sirven los teoremas de Gödel. 7 Tres ejemplos: Hilbert’s Finitism, de Richard Zach; Hilbert’s Program. An Essay on Mathematical Instrumentalism, de Michael Detlefsen e Inexhaustibility, a non-exhaustive treatment, de Torkel Franzén. 8 Cinco antologías destacadas: Basic Papers On Undecidable Propositions, Unsolvable Problems And Computable Functions, de Martin Davis; From Frege to Gödel: A Source Book in Mathematical Logic, de Jean van Heijenoort; From Kant to Hilbert: A Source Book in the Foundations of Mathematics, de William B. Ewald, From Brouwer to Hilbert: The Debate on the Foundations of Mathematics in the 1920s, de Paolo Mancosu y Gödel’s Theorem in focus, de S. G. Shanker. P REFACIO VI ontología, filosofía del lenguaje), y no desde las preocupaciones de quienes, desde la matemática, participan o se inician en los debates.9 Esto requiere de una explicación o discusión más detallada. Como área de estudio, la filosofía de la matemática se puede contemplar desde dos perspectivas: desde el punto de vista de la filosofía misma y desde el punto de vista de quienes practican la matemática. Frente a esta alternativa, nuestra elección ha sido clara. Se trata de mirar los problemas filosóficos a que dio lugar la matemática desde la perspectiva de quienes primariamente se consagraron a esta ciencia y, de manera complementaria, decidieron reflexionar sobre ella, seguros de que esta labor enriquecía el valor cultural y perfilaba los derroteros seguidos por la matemática. Es de tales cuestiones que nos ocupamos en estas páginas.10 Esto de ninguna manera significa que sintamos desprecio o rechazo por el otro punto de vista.11 Más bien, nuestra preferencia por el enfoque “internalista” es natural: ahí están nuestras raíces, al igual que las de Hilbert, cuya visión es la de un matemático activo, no la de alguien cuyas preocupaciones iniciaron al contemplar la matemática desde la filosofía. Esta postura tiene la ventaja de que en ella se parte de la comprensión calificada de ciertos campos de la matemática, la cual es indispensable si se quiere discurrir filosóficamente acerca de ella. Históricamente, esta postura marcó una diferencia en la manera de abordar los problemas. De hecho, un mérito de Hilbert consistió en tratar de resolver diversos problemas filosóficos relativos a la matemática haciendo matemáticas, es decir, construyendo una 9 Un claro ejemplo de esto es el libro The Provenance of Pure Reason de William Tait. mis alumnos y colegas me preguntaban por un texto que tratara estos temas desde la óptica de la matemática misma, ofreciendo a la vez una panorámica más o menos completa, lo único que podía mencionar eran algunos trabajos que de alguna manera llenan los huecos, sin cubrirlos todos. Algunos ejemplos son: (i) El libro Gödel’s Proof de Nagel y Newman, en el que se ofrece una breve explicación del contexto en que se dieron los teoremas de Gödel, junto con una exposición informal de los mismos, deficiente y sesgada; (ii) El libro A Profile of Mathematical Logic de Howard DeLong, donde se tiene una explicación razonable de los teoremas de Gödel, y se mencionan algunos puntos de interés para la filosofía de las matemáticas relacionados con los teoremas limitativos, pero nada más; (iii) El libro The Philosophy of Mathematics de Stephan Körner, donde el autor analiza los puntos de vista de ciertos filósofos (Platón, Aristóteles, Leibniz, Kant), y pasa lista a las tres escuelas clásicas de principios del siglo XX (logicismo, formalismo e intuicionismo), sin incursionar en la historia o examinar los problemas propiamente matemáticos en torno a los que estas escuelas se conformaron; (iv) El libro Mathematical Logic and the Foundations of Mathematics de G. T. Kneebone, en el que, de manera por demás técnica, el autor sigue el desarrollo de la lógica matemática, los problemas que se presentaron en torno a los fundamentos a finales del siglo XIX, las distintas escuelas que surgieron del así llamado “periodo crítico” y pasa lista a distintos aspectos de la matemática (su epistemología, su aplicabilidad, etc.) cual si fuera un desfile temático. Así, por ejemplo, el intuicionismo aparece tras haber expuesto, en capítulos sucesivos, la matemática formalizada de Hilbert y los teoremas de Gödel, como si nada tuviera que ver con ellos. Por último debemos mencionar el ya citado libro de Paolo Mancosu, The Debate on the Foundations of Mathematics in the 1920s, un excelente tratado que, sin embargo, se limita a un periodo muy preciso de tiempo: a la década 1920-1930. 11 Esto sería absurdo, tratándose de un libro de filosofía de las matemáticas. 10 Cuando VII teoría matemática (la teoría de la demostración) para resolverlos. Dicho de otra manera: lo que Hilbert hizo fue reflexionar en torno a los problemas relativos a los fundamentos de la matemática desde la matemática misma, dirigiéndose en todo momento a sus colegas y no a quienes desde la filosofía mostraban algún interés en ella. Lo mismo podemos decir, en mayor o menor medida, de otros participantes en el debate (v. gr., Cantor, Poincaré, Brouwer), cuyas posturas habremos de examinar. Un problema que trajo consigo un estudio tan especializado de los fundamentos de las matemáticas fue que su desarrollo se dio en estrecha dependencia con métodos y técnicas que dificultan su comprensión. En particular, muchas ideas se presentan tras un lenguaje técnico que las obscurece y aleja del no especialista.12 Los matemáticos, principales conductores de estas investigaciones, establecieron nuevas formas de análisis, pero lo hicieron levantando una barrera conceptual y metodológica que dificulta la comprensión de su trabajo (v. gr., la teoría de la cuantificación de Frege, la teoría de tipos de Russell, el predicativismo de Poincaré y Weyl, etc.) Con respecto a esto, en este libro intentamos aclarar muchas de las ideas comprendidas en tales indagaciones, ya sea en el texto principal o en los apéndices, cuya inclusión obedece a nuestro deseo de ofrecer un texto autocontenido. Para concluir esta sección diremos lo siguiente. Si alguien nos preguntara porqué un matemático con inclinaciones filosóficas o un filósofo con inclinaciones matemáticas debe ocuparse de todo este material en apariencia antiguo, nuestra respuesta sería otra pregunta: ¿Por qué se interesa usted en las matemáticas?13 Es muy difícil explicar a los no matemáticos porqué sentimos tal apego a esta materia, o porqué la misma plantea problemas tan serios a la filosofía. Una respuesta a lo anterior se halla en lo que aquí narramos, en los cambios ocurridos en la matemática en la segunda mitad del siglo diecinueve y principios del veinte, en los nuevos puntos de vista que surgieron acerca de su naturaleza —desde el riguroso logicismo de Frege hasta la cruda concepción sintáctica del programa de Hilbert— y en la obra de Gödel, quien nos reveló una matemática inagotable, por siempre abierta a la incorporación de nuevos métodos y principios, en ocasiones tan abstracta que parece recorrer las fronteras del pensamiento mismo. Si esto no le parece sorprendente al lector, una opción no dolorosa será que cierre el libro y se ocupe de otras cosas.14 12 Algo que en gran medida es inevitable. 13 ¿Acaso el lector jamás se ha preguntado por la naturaleza y el carácter del conocimiento matemático?, ¿por qué éste, que no necesita considerar el vínculo entre sus conceptos y la realidad objetiva, constituye a la vez un elemento clave en la comprensión de la naturaleza? ¿Alguna vez ha intentado ofrecer una respuesta a estas preguntas? 14 Entre los cambios ocurridos en la matemática durante este periodo podemos mencionar los siguientes: la aparición de la teoría de los números transfinitos de Cantor, el estudio de los espacios de dimensión infinita (v. gr., los espacios de Hilbert), la aparición del álgebra moderna con sus estructuras abstractas (v. gr., lo hecho por Emmy Noether: teoría de ideales en anillos conmutativos, álgebras no conmutativas, números hipercomplejos, teoría de grupos y su relación con la teoría de módulos e ideales, etc.), o el desarrollo del análisis matemático (v. gr., lo hecho por Borel: teoría de la medida y la moderna teoría de la probabilidad). Esto son apenas algunos ejemplos, sin siquiera mencionar lo sucedido en la topología, la teoría de juegos, la geometría, etc. P REFACIO VIII Por último tenemos una segunda respuesta a la pregunta sobre el interés en estas cuestiones. La educación universitaria no sólo consiste en aprender una especialidad y mirar hacia lo nuevo; también entraña la adquisición de una formación integral y la preservación de nuestra memoria histórica. Concentrarse exclusivamente en lo nuevo o, peor aún, en los contenidos específicos de una disciplina, constituye un error que debemos evitar. No se puede limitar la educación universitaria a tales empeños. Por el contrario, más allá de la preparación técnica, la educación debe ofrecer una visión global de lo que se estudia, generando a la vez principios y actitudes a través de los cuales los individuos puedan sentir, vivir y expresarse. En cierta ocasión Albert Einstein se refirió al fin último de la educación con las siguientes palabras: No basta con enseñar a un hombre una especialidad. Aunque esto pueda convertirle en una especie de máquina útil, no tendrá una personalidad armoniosamente desarrollada. Es esencial que el estudiante adquiera una comprensión de los valores y una profunda afinidad hacia ellos. Debe adquirir un vigoroso sentimiento de lo bello y lo moralmente bueno. De otro modo, con la especialización de sus conocimientos más parecerá un perro bien adiestrado que una persona armoniosamente desarrollada. (Albert Einstein en The New York Times, 5 de octubre de 1952). Un modo de equilibrar el desarrollo de los alumnos consiste en enseñar, junto con los contenidos propios de la matemática, su historia y filosofía, lo cual ensancha la visión que se tiene de la llamada “Reina de las ciencias”15 , permitiendo una mejor comprensión de su carácter y su lugar en la ciencia, la cultura y la sociedad.16 Sobre la estructura del libro En su estructura el libro sigue básicamente un orden cronológico, sin no pretender ser una historia de los problemas considerados o un tratado íntegro sobre el debate 15 Bressoud, D., The Queen of Sciences, A History of Mathematics, (DVD) The Teaching Company, 2008. 16 En la actualidad, hay un intenso debate acerca del papel de la educación humanística en las carreras científicas. No se trata de algo intrascendente: hay sitios donde ya se han limitado o cerrado los programas en artes y humanidades a causa de una visión tan limitada como la de juzgar su valor en términos de “productividad” (criterio que también se utiliza para opinar sobre la inutilidad de enseñar “ciencia pura”). Sí, leyó usted bien: los mismos criterios que privan en el mercado se aplican en la educación. Con base en tales criterios se aboga por suprimir o mantener en los niveles estrictamente “necesarios” la enseñanza y la investigación en temas como la historia, la literatura, la ética y la filosofía. La idea, en palabras de Eduardo Galeano, es muy simple: Se condena lo que es inútil y es inútil lo que no es rentable. Esta tendencia no es sólo local, sino global. En un breve artículo publicado en la revista Nature, Gregory Petsko, bioquímico de la Universidad de Brandeis, expone con claridad (y en una sola página) la importancia de la enseñanza de las humanidades a los estudiantes de ciencias, y la trascendencia de no cerrar o limitar los programas en artes y humanidades en las universidades. Recomendamos su lectura. La referencia completa es: Gregory Petsko, “Save university arts from the bean counters”, Nature, 23/30 December, 2010, vol. 468. El título, traducido al español de México, es muy sugerente: “Salven las letras, las artes y las humanidades de los cuentachiles en las universidades”. IX en torno a los fundamentos de las matemáticas que se diera a inicios del siglo XX. El libro comienza con un análisis del carácter de la geometría euclidiana y culmina con la presentación de la filosofía matemática de Kurt Gödel. El orden y selección de los temas obedece al propósito de seguir y entender el desarrollo del pensamiento de Hilbert y la manera en que Gödel puso fin a sus pretensiones. Con este criterio fueron muchas las cosas que no fueron tomadas en cuenta.17 Una ventaja del orden cronológico es que nos permite resaltar la diferencia entre la matemática tradicional y la llamada matemática moderna, cuya aparición dio lugar al problema de los fundamentos suscitado a principios del siglo veinte.18 Otra ventaja, decisiva para la organización de este trabajo, es que el orden cronológico nos posibilita exponer los problemas y resultados de las investigaciones en torno a los fundamentos de la matemática de manera accesible al no especialista. Con ello buscamos dos cosas: primero, tender un puente entre la matemática y la filosofía; segundo, hacer claro al lector el contraste entre una vertiente de la matemática actual, abstracta y sofisticada, y la matemática tradicional, que en gran medida refleja nuestras intuiciones. Por último tenemos una consideración de orden teórico. Despuès de leer a Paul Bernays19 , llegamos a la conclusión de que al explorar un tema como el de los fundamentos de las matemáticas no es necesario elegir entre los distintos puntos de vista analizados (intuicionismo, finitismo, logicismo, platonismo, etc.); más bien, lo relevante es formular de manera precisa tales puntos de vista y establecer sus diferencias, similitudes y mutuas relaciones. La idea que guía esta investigación es precisamente la de sopesar los argumentos de los distintos actores, para así comprender de mejor manera lo hecho por Hilbert y Gödel. Sobre el carácter del libro Mientras pensaba en las palabras que habría de incluir hacia el final de este prefacio, cayó en mis manos, como por arte de magia, un libro de aforismos de Leonardo da Vinci.20 En él, en una sección titulada “Leonardo al lector”, hallé los siguientes pasajes en los que da Vinci expresa con suma claridad y sentido literario muchas de las sensaciones que me ha producido la escritura de esta obra. Si bien no todo lo que dice es pertinente en mi caso, pues las ideas que tomo no son de escaso valor, ni comparo 17 Por mencionar una de ellas: el debate entre Poincaré y Russell sobre la naturaleza del razonamiento matemático y el papel de la lógica en las matemáticas. 18 Aquí por matemática moderna se entiende, no la matemática que parte de Descartes y Fermat, sino la matemática surgida a mediados del siglo diecinueve y que en espíritu se aparta de la que le precede; y si bien no es posible establecer una clara demarcación entre la matemática tradicional y la matemática moderna, por matemática tradicional entendemos el cuerpo de teorías y métodos conocidos desde la antigüedad hasta principios del siglo diecinueve, y que por entonces no se habían separado del todo de la física. Al respecto, esta distinción se aclarará al leer los primeros capítulos, en los que esta cuestión se trata con cierto detenimiento. 19 Bernays, 1935. 20 Leonardo Da Vinci Aforismos (selección y traducción: E. García de Zúñiga), Espasa Calpe Argentina S. A., Colección Austral, 2003. P REFACIO X las aulas universitarias con “pobres caseríos”, reproduzco textualmente sus palabras, para después recrearlas libremente. La numeración es la del libro de aforismos: Leonardo al lector 1. Considerando que no podía encontrar una materia de gran utilidad o agrado, puesto que los hombres nacidos antes que yo habían tomado para sí los temas útiles y necesarios, haré como el que, a causa de su pobreza, llega el último a la feria y, no pudiendo surtirse de otro modo, compra cosas ya vistas por los otros y desechadas por ellos a causa de su escaso valor. 2. Emplearé en la adquisición de esa mercadería despreciada, rechazada y proveniente de muchos mostradores, mi escaso peculio, y así recorreré, no las grandes ciudades, sino los pobres caseríos, distribuyendo las cosas de que dispongo y recibiendo por ellas el precio que merecen. 3. [...] todo esto forma una recopilación sin orden de muchas hojas sueltas, a la espera de clasificarlas según la materia de que tratan. Creo que, antes de llegar al fin, repetiré muchas veces las mismas cosas. Si ello ocurre, no me critiques, lector. Las cosas son en gran número y la memoria no puede retenerlas todas. Yo no quisiera escribir lo que ya he dicho; pero, para no incurrir en ese error sería menester que cada vez que agrego algo, releyese todo lo pasado, lo que me ocuparía mucho tiempo, pues escribo a largos intervalos y fragmento por fragmento. 4. Que no me lea quien no sea matemático, porque yo lo soy siempre en mis principios. En una libre adaptación de las palabras de Leonardo, y sin su aquiescencia por obvias razones, modifiqué, tergiversé y extendí los cuatro aforismos precedentes a fin de comunicar al lector cuales fueron mis propósitos al escribir esta obra... y lo que pienso de ella. Mantengo la numeración de Leonardo: Al lector 1. Considerando que no podía desarrollar nuevas ideas de gran originalidad, puesto que muchos grandes hombres y mujeres ya lo habían hecho antes que yo, decidí hacer como quien llega tarde al debate y se entretiene examinando, trenzando, ataviando, afinando y desechando las ideas de los otros. 2. En la adquisición de esas ideas, provenientes de grandes pensadores y ya examinadas por otros antes que yo, he empleado mi escaso peculio, evitando la falsa pretensión de originalidad en aquello que tan sólo he forjado con su ayuda. Más bien, lo que he sido es un recolector de las buenas prendas elaboradas por XI otros, con algunos cambios o mejoras. Puedo decir entonces que mi mercancía no la ofrezco a los grandes comerciantes, quienes con todo su capital aguardan nuevos productos de aparente originalidad para así continuar sus interminables regateos; más bien, la ofrezco a quienes buscan complacerse con las cosas que dispongo, recibiendo a cambio el precio que merecen. Estos destinatarios son los universitarios y estudiosos que deseen acercarse con gusto y mesura a la obra lógica y filosófica de Hilbert y Gödel, y todos aquellos que aspiren a comprender los grandes cambios que hubo en la matemática y su filosofía a finales del siglo XIX y principios del XX. 3. El libro es el resultado de organizar una recopilación de temas que se fue formando sin orden aparente, a la espera de ser clasificados.21 Creo que en él repito muchas veces las mismas cosas. Si ello ocurre no me critiques, lector. Tengo, además de buenas razones didácticas, el disuasivo argumento de Leonardo: las cosas son en gran número y mi memoria no puede retenerlas todas. Aunque yo no quisiera escribir lo que ya he dicho, para no incurrir en ese error hubiera sido necesario que cada vez que agregara algo releyera todo lo pasado, lo que llevaría mucho tiempo, pues escribo a largos intervalos y fragmento por fragmento.22 4. Que el presente texto no lo lea quien no lo haga desde la perspectiva de la matemática misma, pues eso es lo que yo hago siempre en mis escritos. Lo dicho en el último inciso no es una mera figura retórica, sino un rasgo distintivo de esta obra. Reiterando lo ya expuesto en párrafos anteriores (aquí está la primera repetición, como lo acabo de advertir en el inciso 3), diré lo siguiente: el presente trabajo incluye escasamente temas que no fueron considerados por quienes, desde la matemática misma, abordaron la discusión de sus fundamentos, principalmente Hilbert y Gödel. Así, poco o casi nada se dice de diversos problemas que la filosofía de la matemática ha considerado relevantes desde una óptica más amplia como, por ejemplo, (i) el relativo al funcionamiento de la lógica como estructura sobre la que se levanta nuestro lenguaje (Wittgenstein, Tractatus lógico-Philosophicus); (ii) el de la necesidad de una teoría semántica para las proposiciones matemáticas que sea homogénea con la del resto del lenguaje, a la vez que compatible con una explicación razonable de la “verdad matemática” (Dilema de Benacerraf, planteado en su artículo “Mathematical Truth” de 1973), o (iii) el argumento de la indispensabilidad, planteado por Quine y Putnam acerca de la necesidad de considerar como existentes los objetos matemáticos dada su ineludible presencia en las ciencias empíricas. 21 Esto incluye Torres 1995, 1999a, 1999b, 2003, 2004, 2005, 2006, 2007, 2009, 2012, 2013 y 2016. cuanto a las razones didácticas, son estas: Estoy convencido de que la repetición produce muy buenos resultados en la enseñanza, es decir, creo firmemente (“a pie juntillas”) que además del razonamiento, la repetición del contenido es un importante pilar del aprendizaje. Este juicio está respaldado no sólo por mi experiencia, sino por algunas investigaciones en materia de educación. En lo que sigue el lector hallará reflejada esta postura. Esto sucederá no sólo con algunas ideas, sino con diversos temas que aparecen de manera repetida en el texto. Al respecto me consuela pensar que en cada caso se añade un nuevo matiz, una perspectiva diferente del concepto o del tema. 22 En XII P REFACIO Los mencionados son apenas una pequeña fracción de los problemas que se debaten en la filosofía de la matemática, y de los que no nos ocupamos en esta obra. La lista anterior podría continuar en forma indefinida. Es muy grande el número de filósofos y matemáticos que no mencionamos y que en su momento se ocuparon de los problemas que aquí tratamos. Personajes como Cassirer, Helmholtz, Husserl, Kolmogorov, Ramsey o Wittgenstein no son citados en el libro (o apenas lo son) por las razones ya expuestas. No debemos olvidar que se trata de un texto en cierta medida introductorio, que sólo se enfoca en ciertos aspectos de la matemática, y en el que ni siquiera se habla de todo lo que inquietó a Hilbert y a Gödel. Por ejemplo, al mencionar las razones que llevaron a Hilbert a escribir los Fundamentos de la geometría nos limitamos a ciertos aspectos de su pensamiento y dejamos de lado muchos otros, como se puede constatar al leer dicha obra o ver lo que dice Bernays al respecto (Bernays, 1959). Igualmente, por mencionar otro ejemplo, al hablar de Gödel dejamos de lado su interés por la obra de Husserl, pues tal aspecto no nos parece relevante para los problemas que nos ocupan en estas páginas. No podemos ni queremos decirlo todo. Lo que sí esperamos, como en toda obra introductoria, es motivar al lector a que durante la lectura de este libro, y después de ella, profundice en los temas que despierten su interés acudiendo a la vasta literatura existente y en continuo crecimiento. Palabras finales Para terminar quiero decir unas palabras acerca de la tensión ocasionada por dos pautas subyacentes a la escritura de este texto, y que parecen incompatibles. Por una parte, el deseo de exponer las cosas con claridad; por la otra, el de hacerlo con exactitud. Al respecto, en los momentos más difíciles he optado, ante mi incapacidad de conciliar en la práctica estos dos propósitos, por la claridad y el afán de ser comprendido, antes que la precisión. Mi intención ha sido en todo momento invitar al lector a que reflexione sobre los problemas que debieron enfrentar los protagonistas de esta historia, a que haga suya la idea, muchas veces olvidada, de que el valor de la educación universitaria es “el adiestramiento de la mente para pensar”.23 No sé si en la práctica esta obra alcance dicho propósito, pero esa ha sido mi intención. Y si bien no creo posible que alguien pueda obtener una visión completa de estos temas sin un esfuerzo considerable (v. gr., del programa de Hilbert o los teoremas de Gödel), también creo que quien los contempla de lejos puede, con todo, formarse una idea razonable de los métodos y resultados de estas ramas de investigación. Habiéndome inclinado por una de estas alternativas, lo que espero es que el lector remedie el rigor faltante ya sea en el aula o acudiendo a la extensa literatura que hay al respecto. Tal fue mi decisión, sustentada en la idea de que en este dominio el primer paso es contemplar el panorama completo, 23 Estas palabras están tomadas del comentario que hiciera Einstein en 1921 cuando, al contestar el test de Edison, no supo la respuesta a la pregunta ¿Cuál es la velocidad del sonido?: “El valor de la educación universitaria no es el aprendizaje de muchos datos, sino el entrenamiento de la mente para pensar.” El test está disponible en línea en http://www.neoteo.com/ superaras-test-inteligencia-thomas-edison XIII asombrarse con la visión del bosque, aun a costa de la precisión que poco a poco habrá de lograrse al recorrerlo por sus múltiples senderos. En esto, el orden histórico ha sido mi mejor aliado. Me ha permitido seguir el curso vivo del pensamiento de Hilbert y Gödel en vez de presentarlo, como tantos autores, como un producto acabado; me ha permitido también comprender y transmitir de mejor manera las circunstancias que determinaron que cada uno de ellos prefiriera un camino sobre cualquier otro. Mi objetivo ha sido en todo momento presentar la matemática y su filosofía como un producto de la historia, como algo sujeto al debate, la duda y la reflexión. En mi opinión, ésta es la mejor forma de acceder al pensamiento de dos matemáticos que con su obra cambiaron nuestra manera de ver nuestra ciencia. Ahora invito al lector a que me acompañe por el camino que me llevó a descubrir que quienes participaron en estas tareas no eran fríos pensadores, incapaces de padecer o sufrir, o individuos llevados tan sólo por el impasible afán de saber y entender, sino seres humanos sujetos también a vehementes impulsos ajenos a la razón: sueños, deseos, pasiones, rivalidades, lealtades e incluso ambición de poder. A fin de cuentas, repito, la matemática y su filosofía constituyen una tarea en la que los participantes también están sujetos a esa clase de vicisitudes. Índice general Preámbulo I Prefacio III Introducción general XXI 1. Euclides, Kant, Hilbert y los fundamentos de la geometría 1 1.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2. La geometría en los Elementos de Euclides . . . . . . . . . . . . . . 3 1.2.1. Los postulados de Euclides y las primeras proposiciones de los Elementos . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.2.2. Algunos comentarios . . . . . . . . . . . . . . . . . . . . . . 14 1.3. La demostración en los Elementos de Euclides . . . . . . . . . . . . . 23 1.3.1. La estructura de las proposiciones en los Elementos . . . . . . 23 1.3.2. La demostración euclidiana y el razonamiento geométrico según Kant . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 1.4. La teoría kantiana de esquemas . . . . . . . . . . . . . . . . . . . . . 28 1.5. La crítica moderna y la lógica . . . . . . . . . . . . . . . . . . . . . 31 1.5.1. Tres sentidos distintos de la palabra “fundamentos” . . . . . . 36 1.6. La geometría en los Grundlagen der Geometrie de Hilbert . . . . . . 38 1.6.1. Dos ideas subyacentes a los Grundlagen . . . . . . . . . . . . 39 1.6.2. La geometría en los Grundlagen . . . . . . . . . . . . . . . . 45 1.6.3. Los axiomas . . . . . . . . . . . . . . . . . . . . . . . . . . 46 1.6.4. Independencia del axioma de continuidad . . . . . . . . . . . 50 1.6.5. El teorema de Desargues y su lugar en la geometría . . . . . . 52 XV Í NDICE GENERAL XVI 1.6.6. Un recorrido a la inversa . . . . . . . . . . . . . . . . . . . . 64 1.6.7. Breves reflexiones . . . . . . . . . . . . . . . . . . . . . . . 65 1.7. Hilbert y la teoría kantiana de esquemas . . . . . . . . . . . . . . . . 66 1.7.1. Nociones ideales y dualidad . . . . . . . . . . . . . . . . . . 68 1.7.2. Un ejemplo de la utilidad del método . . . . . . . . . . . . . 69 1.7.3. Nuevos objetos, nuevas matemáticas . . . . . . . . . . . . . . 71 1.7.4. Comentarios finales . . . . . . . . . . . . . . . . . . . . . . . 73 1.8. La consistencia de la geometría . . . . . . . . . . . . . . . . . . . . . 75 1.8.1. La relación entre las nuevas geometrías y la euclidiana . . . . 75 1.8.2. La consistencia de la geometría euclidiana plana . . . . . . . 77 1.9. Cuestiones complementarias . . . . . . . . . . . . . . . . . . . . . . 80 1.9.1. La naturaleza de la geometría: El punto de vista de Kant . . . 80 1.9.2. El apriorismo en la matemática después de Kant . . . . . . . 84 1.9.3. El punto de vista de Hilbert . . . . . . . . . . . . . . . . . . 85 1.9.4. Un epígrafe tomado de la Crítica de la razón pura de Kant . . 87 1.9.5. El análisis lógico: un ejemplo . . . . . . . . . . . . . . . . . 89 2. La matemática moderna y la teoría de conjuntos 93 2.1. La nueva matemática . . . . . . . . . . . . . . . . . . . . . . . . . . 93 2.2. El álgebra moderna . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 2.2.1. El álgebra de Boole . . . . . . . . . . . . . . . . . . . . . . . 95 2.2.2. Los cuaternios de Hamilton . . . . . . . . . . . . . . . . . . 97 2.3. La teoría de grupos y el programa de Erlangen . . . . . . . . . . . . . 102 2.4. La física cuántica y la teoría de grupos . . . . . . . . . . . . . . . . . 107 2.5. La aritmetización del análisis . . . . . . . . . . . . . . . . . . . . . . 110 2.6. La teoría de los números transfinitos de Cantor . . . . . . . . . . . . 114 2.6.1. El concepto de infinito en la teoría de conjuntos . . . . . . . . 115 2.6.2. Conjuntos, funciones, relaciones y estructuras abstractas . . . 117 2.6.3. Los comienzos de la teoría cantoriana: conjuntos de números . 118 2.6.4. La hipótesis del continuo . . . . . . . . . . . . . . . . . . . . 123 2.6.5. El axioma de elección . . . . . . . . . . . . . . . . . . . . . 126 2.6.6. Dos comentarios y un epílogo . . . . . . . . . . . . . . . . . 130 Í NDICE GENERAL XVII 3. La cuestión de los fundamentos a principios del siglo veinte 133 3.1. Introducción. El problema de los fundamentos . . . . . . . . . . . . . 133 3.2. El logicismo de Frege . . . . . . . . . . . . . . . . . . . . . . . . . . 134 3.3. Las paradojas o antinomias . . . . . . . . . . . . . . . . . . . . . . . 139 3.4. La propuesta de Hilbert de 1904 . . . . . . . . . . . . . . . . . . . . 146 3.4.1. La aritmética como un sistema de fórmulas . . . . . . . . . . 151 3.5. La teoría axiomática de Zermelo-Fraenkel . . . . . . . . . . . . . . . 153 3.6. Poincaré, Weyl y el predicativismo . . . . . . . . . . . . . . . . . . . 163 3.6.1. Poincaré . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163 3.6.2. Poincaré ante el formalismo de Hilbert y la teoría de Cantor . 165 3.6.3. El principio del círculo vicioso y las definiciones no predicativas167 3.6.4. Weyl y Feferman . . . . . . . . . . . . . . . . . . . . . . . . 170 3.7. El logicismo de Russell y Whitehead . . . . . . . . . . . . . . . . . . 175 3.8. El intuicionismo de Brouwer . . . . . . . . . . . . . . . . . . . . . . 180 3.8.1. El principio del tercero excluido . . . . . . . . . . . . . . . . 182 3.8.2. Comentarios generales . . . . . . . . . . . . . . . . . . . . . 187 4. El programa de Hilbert 193 4.1. Los inicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193 4.1.1. La cuestión de la resolubilidad de todo problema matemático (parte 1) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196 4.1.2. Una contienda filosófica . . . . . . . . . . . . . . . . . . . . 199 4.2. La naturaleza de la matemática clásica según Hilbert . . . . . . . . . 200 4.2.1. La naturaleza, el entendimiento y el infinito . . . . . . . . . . 202 4.2.2. El infinito en la matemática . . . . . . . . . . . . . . . . . . 204 4.2.3. La matemática clásica . . . . . . . . . . . . . . . . . . . . . 205 4.2.4. Un cambio en el punto de vista . . . . . . . . . . . . . . . . 215 4.3. La intuición del signo . . . . . . . . . . . . . . . . . . . . . . . . . . 218 4.4. El programa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227 4.4.1. La formalización . . . . . . . . . . . . . . . . . . . . . . . . 227 4.4.2. Posibilidad de una prueba finitista de consistencia . . . . . . . 230 4.4.3. La teoría de la demostración . . . . . . . . . . . . . . . . . . 238 Í NDICE GENERAL XVIII 4.4.4. Las cuestiones de la resolubilidad (parte 2), la completud y el problema de la decisión . . . . . . . . . . . . . . . . . . . . 243 4.4.5. El programa: un resumen . . . . . . . . . . . . . . . . . . . . 251 4.4.6. Comentarios finales . . . . . . . . . . . . . . . . . . . . . . . 254 5. La intervención de Gödel 257 5.1. El espíritu de una época: verdad y demostrabilidad . . . . . . . . . . 257 5.1.1. La introducción de 1929 . . . . . . . . . . . . . . . . . . . . 257 5.1.2. El espíritu de la época . . . . . . . . . . . . . . . . . . . . . 262 5.2. Los teoremas de Gödel . . . . . . . . . . . . . . . . . . . . . . . . . 264 5.2.1. La vía del descubrimiento . . . . . . . . . . . . . . . . . . . 266 5.2.2. Una prueba heurística . . . . . . . . . . . . . . . . . . . . . 268 5.2.3. La cuestión de la autorreferencia . . . . . . . . . . . . . . . . 275 5.2.4. Comentarios . . . . . . . . . . . . . . . . . . . . . . . . . . 277 5.3. Los teoremas de Gödel en nuestro tiempo . . . . . . . . . . . . . . . 281 5.4. Los teoremas de Gödel, el programa de Hilbert y las matemáticas . . . 288 5.4.1. Consecuencias para la filosofía y el programa de Hilbert . . . 288 5.4.2. La cuestión de la completud . . . . . . . . . . . . . . . . . . 289 5.4.3. La cuestión de la consistencia . . . . . . . . . . . . . . . . . 291 5.4.4. Gentzen et al . . . . . . . . . . . . . . . . . . . . . . . . . . 295 5.4.5. La cuestión del instrumentalismo . . . . . . . . . . . . . . . 298 5.4.6. Consecuencias para la matemática en general . . . . . . . . . 305 5.5. Los teoremas de Church y Turing y el problema de la decisión . . . . 310 5.5.1. El problema de la decisión y las máquinas de Turing . . . . . 311 5.5.2. El problema de la detención y la máquina universal . . . . . . 313 5.5.3. El problema de la decisión . . . . . . . . . . . . . . . . . . . 314 5.6. Algunas reflexiones de Gödel en torno a los teoremas limitativos . . . 316 5.6.1. Precisiones en torno a la noción de algoritmo . . . . . . . . . 316 5.6.2. El enunciado de Gödel y las ecuaciones diofánticas . . . . . . 318 5.6.3. Reflexiones de Gödel . . . . . . . . . . . . . . . . . . . . . . 319 5.7. El problema de la decisión, el computabilismo y la resolubilidad de todo problema matemático (parte 3) . . . . . . . . . . . . . . . . . . 324 Í NDICE GENERAL XIX 6. Gödel y la defensa del realismo conceptual 331 6.1. ¿Es la matemática una libre creación del espíritu humano? . . . . . . . 331 6.1.1. ¿Lo es? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 331 6.1.2. Crítica al nominalismo y al positivismo lógico . . . . . . . . 336 6.2. Salvaguarda del realismo . . . . . . . . . . . . . . . . . . . . . . . . 340 7. Reflexiones finales 345 7.1. Algunas consideraciones en torno a Hilbert... y Gödel . . . . . . . . . 345 7.1.1. El contexto . . . . . . . . . . . . . . . . . . . . . . . . . . . 345 7.1.2. Algunas reflexiones en torno al pensamiento de Hilbert . . . . 349 7.1.3. ¿Qué habría sucedido si Hilbert hubiera tenido éxito con su programa? . . . . . . . . . . . . . . . . . . . . . . . . . . . 353 7.2. Conclusión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 356 Apéndices A. Un comentario sobre la demostración en Euclides 361 A.1. Un ejemplo de razonamiento diagramático utilizado por Pascal en el siglo XVII . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 362 B. Un comentario acerca de la geometría de Lobachevsky y dos modelos para las geometrías no euclidianas 369 C. Axiomas de Hilbert para la geometría 375 D. Una prueba de consistencia para la geometría euclidiana 383 E. Los números complejos 389 F. La teoría cantoriana de conjuntos 393 G. Las antinomias y la matemática 411 H. Un argumento en contra del principio del tercero excluido 415 I. Una guerra de ranas y ratones 417 XX Í NDICE GENERAL J. La inducción matemática y las definiciones por recursión 421 K. El método de los elementos ideales 427 L. El concepto de sistema formal 429 M. Un cálculo deductivo para la lógica de primer orden (cálculo de predicados) 439 N. Lenguaje y metalenguaje 443 Ñ. La teoría de Zermelo-Fraenkel como sistema formal 447 O. Un sistema formal para la aritmética de Peano 451 P. Aritmetización de la sintaxis de AB 455 Q. Usos y abusos de los teoremas de Gödel 461 R. Una prueba de consistencia para la aritmética de Peano (la prueba de Schütte) 467 S. Acerca de las máquinas de Turing 471 T. Las pruebas de existencia no constructivas y la filosofía de las matemáticas 485 Referencias bibliográficas 491 Introducción general A lo largo de la historia la filosofía ha propuesto diversas concepciones de la matemática a partir de las cuales se han derivado criterios acerca de lo que son sus objetos, sus métodos, la verdad de sus conclusiones y su relación con lo “real”. Dos claros ejemplos de ello son la explicación que ofrece Platón de los objetos matemáticos con base en su teoría de las formas, y la que ofrece Descartes con base en su teoría de las ideas innatas.24 Con el tiempo muchas de estas concepciones han entrado en conflicto con los cambios sucedidos en la matemática. Por ejemplo, a partir del desarrollo de las geometrías no euclidianas la noción de espacio absoluto de Kant ya no fue sostenible. Al crear otras geometrías diferentes de la euclidiana, la matemática mostró la posibilidad de postular nuevos espacios mediante otros conceptos, reivindicando con ello la libertad de que goza para determinar su objeto de estudio.25 Lo anterior no fue un hecho aislado. Por el contrario, tras los cambios habidos en la matemática del siglo XIX, muchas de las tesis que sostuviera Kant en la Crítica de la razón pura respecto de la matemática debieron ser revisadas o rechazadas. V. Gr., a partir del surgimiento de la teoría de conjuntos y el álgebra abstracta, la teoría de Kant acerca de la construcción de conceptos en la intuición pura (predominante hasta entonces) resultó ser demasiado restrictiva. Esta incapacidad para dar cuenta de la 24 Precisemos esto último. Descartes afirma que los objetos matemáticos (triángulos, números, etc.) no tienen existencia fuera de su pensamiento, no son fingidos por él, son de naturaleza verdadera e inmutable y no dependen de ninguna manera de su espíritu. Afirma también que éstos no han llegado a él por medio de los sentidos y que, no obstante, son algo, en vez de nada. Se trata, en una palabra, de ideas innatas, ideas que el espíritu posee por sí mismo y que no puede cambiar. Por ejemplo, el que los tres ángulos de un triángulo valgan dos rectos es inherente a la idea de triángulo, algo que se puede demostrar pero no cambiar, una propiedad que, querámoslo o no, debemos reconocer una vez que se presenta de manera clara y distinta ante el espíritu. Al respecto, lo que tenemos ante nosotros es una posición tomada desde la filosofía, y con base en ella se ofrece una explicación de la naturaleza de los objetos matemáticos. 25 Santiago Ramírez expresa estas ideas de la siguiente manera: “Ante la afirmación de que el espacio físico (de Newton) es euclidiano, las matemáticas responderían que ellas están hablando de un espacio que no es aquel en donde tienen lugar los fenómenos físicos, con lo cual estaría estableciendo, con el mismo derecho y la misma legitimidad que la física, la existencia de un espacio propiamente matemático. Al mismo tiempo, no estarían imponiendo a la física una idea de espacio contradictoria con la que la explicación del mundo de la física hace necesaria. En todo caso, las matemáticas funcionarían como una crítica de la noción de espacio newtoniano, que ulteriormente habría de servir de fundamento matemático para las nuevas teorías físicas.” (Ramírez, 1990, p. 420.) XXI XXII I NTRODUCCIÓN GENERAL nueva matemática no sólo llevó a cuestionar la filosofía crítica de Kant, sino a la idea, compartida por muchos matemáticos, de ya no sujetar su disciplina a preceptos provenientes de fuera de ella, es decir, a buscar respuestas al problema de sus fundamentos y la naturaleza de sus objetos desde el interior de la matemática misma.26 Esta postura se fortaleció en el último tercio del siglo diecinueve y principios del veinte, donde matemáticos como Dedekind, Cantor, Poincaré, Brouwer, Weyl y Hilbert buscaron, con base en su experiencia y visión interna, ofrecer distintas alternativas en la filosofía de las matemáticas, las cuales en su conjunto constituyeron una especie de “visión desde la otra orilla” que en sus reflexiones partían de la matemática misma, escuchándola y siguiéndola atentamente en su desarrollo. Un caso extremo de esta actitud lo tenemos en David Hilbert y Kurt Gödel. Tras haber trabajado arduamente en torno a los fundamentos de la geometría a finales del siglo diecinueve, en los años 1917-1930 Hilbert elaboró un programa en el que la filosofía y la matemática se entremezclaron. Su propósito era responder ciertas cuestiones relativas a los fundamentos de la matemática, las cuales tenían una connotación filosófica muy precisa. Con ello intentaba algo extraordinario: dar fin a una disputa filosófica resolviendo diversos problemas matemáticos muy precisos. En cuanto a su planteamiento, su intención era dar un fundamento matemático a la matemática misma, recurriendo para ello a un número muy reducido de supuestos filosóficos modelados a partir de la práctica matemática. La apuesta de Hilbert –la matemática es capaz de dar cuenta de su propio fundamento– presupuso un cambio en la relación entre la matemática y la filosofía, en la que esta última adopta una postura no impositiva sino consultante, y que basa sus conclusiones en la propia matemática. Por su parte Gödel, defensor del realismo conceptual en la matemática, no sólo opuso al proyecto de Hilbert objeciones de corte filosófico, sino que, actuando de la misma manera, emprendió una investigación matemática del problema, hasta concluir con una negativa a las pretensiones de Hilbert, basada esta vez en dos teoremas de su creación.27 Como consecuencia de este cambio de actitud, la investigación de los fundamentos de las matemáticas se dio –como ya lo hemos dicho en el prefacio– en conexión con estudios especializados que dependen de métodos y técnicas que dificultan su comprensión. De esta manera el problema al que nos enfrentamos es doble: por una 26 No obstante, como más adelante veremos, las cuestiones relativas a la concepción de Kant de la intuición y la construcción de conceptos, las cuales se hallan en el núcleo de su epistemología de las matemáticas, no fueron desechadas sin más, sino que, por el contrario, siguieron presentes en los debates filosóficos no sólo del siglo XIX, sino en los tiempos recientes. Respecto a lo sucedido en aquel entonces, véanse, entre otras, las secciones 1.3, 1.4, 1.6, 1.7, 3.1, 3.6, 3.8, y 4.3. Se trata de un tema que reviste una enorme importancia para este trabajo. 27 El trasfondo de estas observaciones es que en manos de Hilbert la matemática pareciera haber declarado su autonomía frente a la filosofía. Para él ya no se trataba de sujetar su modo de ser a los dictados de esta última (v. gr., reconocer su naturaleza constructiva conforme a lo establecido por Kant), ni de aguardar a que alguna filosofía diera una respuesta a la pregunta por los fundamentos. Más bien, se trataba de que la matemática tomara en sus manos la solución de estos problemas y los abordara con sus propios medios, extrayendo de aquella si acaso las constricciones mínimas y los principios generales sobre los cuales habría de apoyarse dicha tarea. XXIII parte, exponer las investigaciones en torno a los fundamentos de las matemáticas a quienes no tienen forzosamente conocimientos de lógica matemática; por la otra, articular entre sí los elementos surgidos de dicha labor y presentar las conclusiones alcanzadas desde una perspectiva menos técnica y más cercana a la filosofía. En función de este doble objetivo, y de los propósitos ya señalados en el prefacio, es que hemos seleccionado los materiales y modelado la estructura de este trabajo. Grosso modo, el libro se divide en dos partes claramente diferenciadas. En la primera de ellas presentamos las circunstancias bajo las cuales Hilbert emprendió el estudio de los fundamentos de la geometría, la postura que adoptó, y algunas conclusiones a las que llegó. Asimismo, comentamos ampliamente el carácter más extendido de la matemática moderna y dirigimos nuestra atención hacia el debate que se suscitó a principios del siglo XX en torno a los fundamentos de la matemática, vivificado por la aparición de las paradojas en la teoría de conjuntos. La ocasión se presta para detallar el punto de vista de algunos participantes cuyo trabajo influyó decisivamente en Hilbert al momento de perfilar el camino que habría de seguir. En la segunda parte del libro explicamos la labor desarrollada por Hilbert en torno a los fundamentos de la matemática entre 1917 y 1930, y la posterior intervención de Gödel. Es entonces que nos ocupamos del estudio del Programa de Hilbert, uno de los proyectos más ambiciosos de la filosofía matemática del siglo XX. Como veremos, este programa es memorable no sólo por el impacto que tuvo en la filosofía de la matemática, sino por el sólido concepto de razón que defiende. La ocasión se presta para realizar una lectura filosófica de los teoremas limitativos de Gödel, que con tanta claridad testimonian lo fructífera que puede ser la relación entre la ciencia y la filosofía. Con su estudio esperamos poner en claro cómo la reducción de un problema filosófico a un problema científico (matemático en este caso) puede tener un efecto positivo.28 Se trata, en fin, de mostrar a qué condujo el intento de Hilbert de dar cuenta de la matemática desde la matemática misma, es decir, de convertir la discusión de sus fundamentos en un asunto interno a esta disciplina. Se trata también de escudriñar algunos resultados que fijaron un límite a la axiomática y a lo que puede probar una teoría matemática, circunscribiendo de este modo los alcances de la razón en este dominio. En cuanto a la filosofía, nuestro interés se centra en algunas tesis como la de la “agotabilidad” –o “exhaustibilidad”– de la matemática, su reductibilidad a sistemas formales 28 La toma de posición que anima a este trabajo no es novedosa. Recupera el espíritu de un sector importante de científicos que a lo largo del siglo veinte replantearon la relación entre la ciencia y la filosofía, y cuya postura se puede resumir en las siguientes palabras de Albert Einstein: “La mutua relación entre la ciencia y la epistemología es digna de mención. Son dependientes una de la otra. La epistemología sin el contacto de la ciencia se convierte en un esquema vacío. La ciencia sin la epistemología es –en la medida en que esto sea concebible en lo absoluto– primitiva y confusa.” El caso que nos ocupa es un ejemplo de esta toma de posición, pero no el único en las investigaciones en torno a los fundamentos de la matemática, muchas de las cuales se han abordado desde una perspectiva propiamente matemática. Muestra de ello son muchos de los trabajos de Bernays, Cavaillès, Curry, Herbrand, Heyting, Poincaré y Wang (véanse las referencias bibliográficas). XXIV I NTRODUCCIÓN GENERAL (reduccionismo) y la inexistencia de límites para la razón matemática (racionalismo extremo).29 Un punto central es examinar con mirada crítica la posibilidad de establecer un fundamento apodíctico (demostrativo) para esta disciplina.30 Al respecto, nuestra tesis es que ya no se puede sostener ningún concepto de la matemática que pase por alto los resultados obtenidos en estas investigaciones, ni se puede esbozar un concepto de razón que no tome en cuenta las limitaciones que los teoremas de Gödel le imponen en este domino, otrora considerado como un paradigma de la racionalidad. Con nuestro análisis esperamos dar sustento a la tesis según la cual cualquier intento por alcanzar una síntesis exhaustiva de los métodos de prueba admisibles en la matemática está condenado al fracaso. En particular, consideramos que nuestro estudio ofrece los elementos suficientes para sostener la siguiente tesis: Que la correcta lectura filosófica de los teoremas limitativos es que la matemática no es susceptible de una racionalización objetiva completa;31 en particular, que nuestra creencia precrítica en la coherencia de la matemática no tiene una justificación formal (discursiva o demostrativa), salvo en aquellos casos en que menos se necesita. O bien: Que la matemática no tiene un fundamento enteramente racional, debiéndose buscar su justificación en otros ámbitos, como el de la práctica, que van más allá de sus límites. La conclusión será entonces que la búsqueda de tal justificación no tiene sentido en tanto que proyecto de fundamentación y que la matemática es más bien una actividad humana similar al arte, que no admite una racionalización total. El trabajo está dividido en siete capítulos y un anexo con veintiún apéndices. Su extensión obedece a una preocupación bastante difundida en el ámbito del cual provengo, consistente en tratar de presentar el trabajo como algo autocontenido, idea que en este caso empalma a la perfección con el propósito de tender un puente entre la matemática y la filosofía. 29 Con esto último nos queremos referir a Leibniz y Hilbert, y tal vez a Descartes, que no reconocen límites para el poder de la razón matemática en ámbito que le es propio. 30 Este análisis se suma a otros cuestionamientos que se han llevado a cabo en diversos campos del conocimiento en torno a la racionalidad, –como, por ejemplo, en la física o la economía– y que tienen como propósito circunscribir sus alcances, recuperando y elaborando a un mismo tiempo otros conceptos como los de incompletud, incertidumbre y complejidad. Al respecto, como caso relevante podemos mencionar la crítica, en la ciencia económica, a la llamada teoría de la elección racional, donde diversos autores han rechazado los modelos de racionalidad social y “agente económico” propuestos en ella. Un notable ejemplo es el ensayo “Los tontos racionales: Una crítica sobre los fundamentos conductistas de la teoría económica”, de Amartya Sen, publicado en Hahn, F. y Hollis, M., Filosofía y teoría económica, Breviarios de Fondo de Cultura Económica, No. 398, 1986, pp. 172-217. 31 Objetiva: que se le puede objetivar en términos de axiomas y reglas de inferencia. XXV Capítulo 1. En el primer capítulo presentamos la labor desarrollada por Hilbert en torno a los fundamentos de la geometría, junto con diversos elementos que nos permitirán contemplar esta tarea desde una perspectiva histórica y filosófica. Comenzamos con un análisis de lo hecho por Euclides en el terreno de la axiomática, señalando al mismo tiempo diferentes rasgos del conocimiento geométrico que estuvieron presentes desde la antigüedad hasta principios del siglo XIX y que, de alguna manera, Kant evidenció en su filosofía crítica. En particular examinamos con cierto detenimiento el carácter de la demostración en los Elementos de Euclides, pues ésta se mantuvo como modelo de razonamiento hasta mediados del siglo XIX. También mostramos la manera en que Kant sentó, acorde con su época, las bases epistemológicas de este tipo de pruebas en la Crítica de la razón pura (1781). Esto es importante en la medida en que Hilbert, al igual que muchos de sus contemporáneos, debieron enfrentar la teoría del conocimiento de Kant al momento de replantear no sólo los fundamentos, sino la naturaleza de la matemática. Así, antes de abordar la reconstrucción que hace Hilbert de la geometría en los Grundlagen der Geometrie (Fundamentos de la geometría) de 1899, consideramos la teoría de esquemas de Kant, una pieza fundamental en su epistemología, y examinamos la crítica situación que alcanzó durante la segunda mitad del siglo XIX. Hacia el final del capítulo ofrecemos una síntesis de la postura de Hilbert en la que ésta se contempla no como una negación de la epistemología de Kant, sino como una generalización de la misma en adecuación con la matemática de su tiempo. Esto nos permitirá, por contraste, entender la noción de existencia matemática propuesta por Hilbert, la cual tenía como base el concepto lógico de no contradicción. La conclusión a la que llegamos es que para Hilbert la matemática es la ciencia de lo posible, donde por “posible” se entiende “aquello que no lleva a contradicciones”. Como veremos, es en dicha noción de existencia donde reside el interés inicial de Hilbert en las pruebas de consistencia como fundamento de las teorías matemáticas, una cuestión cuya investigación se convirtió en un tema principal de su programa en los años veinte. Capítulo 2. En el segundo capítulo llevamos a cabo un análisis del carácter de la matemática moderna a principios del siglo XX, señalando algunos pasajes de interés. Esta sección tiene como propósito precisar qué es aquello que Hilbert pretende fundamentar y cumple una función más bien informativa. Si el lector ya está familiarizado con lo sucedido en la matemática durante la segunda mitad del siglo XIX y principios del XX, puede obviar la lectura de este capítulo sin menoscabo alguno. En la parte final dirigimos nuestra atención a la teoría de conjuntos de Cantor, uno de los puntos más atrayentes de la nueva matemática. La conclusión a la que llegamos es que uno de los elementos que marcan la diferencia entre la matemática tradicional y la matemática moderna es el trato que se le da a la noción de infinito. Esta diferencia nos permitirá delimitar el ámbito de las discusiones en torno a la naturaleza de la matemática. Hacia el final del capítulo abordamos el problema de la autonomía de la matemática, que con tanta vehemencia defienden Cantor y Hilbert. XXVI I NTRODUCCIÓN GENERAL Capítulo 3. En éste capítulo exponemos la postura adoptada por distintos actores en el debate sobre la naturaleza y los fundamentos de la matemática clásica que se dio a finales del siglo XIX y principios del XX.32 Comenzamos con el logicismo de Frege y el efecto que tuvieron en su proyecto las paradojas descubiertas en la teoría de conjuntos. La ocasión se presta para exponer la paradoja de Richard, la cual sería utilizada por Gödel como modelo de razonamiento en la prueba de su primer teorema de incompletud. Seguidamente presentamos la postura que adoptan Hilbert, Zermelo, Poincaré, Brouwer, Weyl y Russell y Whitehead frente a los fundamentos de la matemática, bajo el entendimiento de que sólo nos ocupamos de aquellos autores que tuvieron algún influjo en la postura que Hilbert adoptó más adelante. En particular, mostramos algunos elementos de la crítica intuicionista que lo obligaron a precisar su concepción de la matemática clásica, e influyeron en la elección que hizo de los medios para establecer un fundamento para ella. Capítulo 4. En este capítulo nos ocupamos primordialmente del llamado programa de Hilbert. En la primera parte examinamos la manera en que Hilbert retomó el problema de los fundamentos de la matemática clásica hacia 1917 y las cuestiones que a la sazón le preocupaban. Podremos ver que, además del problema de la consistencia, Hilbert incorpora dos cuestiones de suma importancia que habrían de persistir más allá de su proyecto: la cuestión de la resolubilidad de todo problema matemático y la cuestión de la decidibilidad de un problema matemático por medio de un número finito de operaciones lógicas. El llamado programa de Hilbert se presenta inicialmente como un medio para asegurar la consistencia de la matemática clásica de manera absoluta. Veremos cómo aparece la metamatemática y cómo es que Hilbert cree haber llevado el estudio de los fundamentos hasta un punto en el que: 1) toda la matemática clásica se habría reducido a una colección de sistemas formales, quizá de manera exhaustiva; 2) todas las técnicas del pensamiento matemático se habrían podido expresar en un juego simbólico formal; y 3) se tenían a la mano los recursos suficientes para justificar la tesis de que todo problema matemático es resoluble. En cuanto a la filosofía, veremos cómo es que el propósito de Hilbert era fundamentar la matemática en la intuición pura del signo, evitando de este modo toda referencia a suposiciones ajenas a la matemática misma. Capítulo 5. En este capítulo nos ocupamos de la exposición y análisis de los teoremas de Gödel y las consecuencias que se pueden extraer de ellos para la filosofía matemática. En la primera parte ofrecemos una idea del camino que siguió Gödel en oposición al punto de vista sintáctico adoptado por Hilbert y algunos miembros del Círculo de Viena, y cómo emprendió el examen del programa de Hilbert desde una postura realista (platonismo). Frente a la pretensión de reducir toda la matemática a sistemas formales y 32 Aquí por matemática clásica se entiende, no la matemática griega, sino aquella surgida en torno a la geometría, la física y el análisis y que tiene como noción central la de número real. En particular nos referimos a la teoría de los conjuntos tal como la desarrolla Cantor, a la llamada “álgebra moderna” y al aspecto que adopta el análisis matemático tras los trabajos de Cauchy, Weierstrass, Dedekind y Cantor en torno a sus fundamentos en el siglo XIX. XXVII de asegurarle un fundamento mediante una prueba elemental de consistencia, veremos cómo plantea la necesidad de retomar la noción de verdad, y cómo es que, inspirado en estas ideas, prueba la existencia de proposiciones indecidibles en la aritmética formal de primer orden y cualquier sistema que contenga una formalización de la aritmética recursiva. Tras aclarar la línea de razonamiento que llevó a Gödel a sus descubrimientos, examinamos la estructura de sus teoremas y los efectos devastadores que éstos tuvieron para el programa de Hilbert. Al hacer lo anterior nos concentramos en diversos puntos: la imposibilidad de identificar entre sí las nociones de verdad y demostrabilidad, la cuestión de la completud de las más importantes teorías matemáticas, la imposibilidad de resolver la cuestión de la consistencia de la manera prevista (y quizá de cualquier otra manera), la cuestión del instrumentalismo que Hilbert incorpora en su programa y la cuestión de la resolubilidad de todo problema matemático. En la segunda parte retomamos el problema de la decisión, mirándolo esta vez desde la perspectiva de los teoremas de Gödel, Church y Turing, y exponemos las reflexiones de Gödel en torno a los teoremas limitativos, estableciendo el alto grado de inviabilidad de la concepción sintáctica de la matemática. Por último, abordamos el problema del computabilismo que tanta importancia cobró a partir de un polémico artículo publicado por Turing en 1950. Capítulo 6. En este capítulo nos centramos en diversos aspectos de la postura de Gödel frente a la matemática. En la primera parte examinamos la crítica que hizo en 1951 a la llamada concepción sintáctica de la matemática (las posturas de Hilbert y de Carnap, principalmente),33 según la cual los hechos y objetos matemáticos no poseen ningún tipo de existencia objetiva. Como veremos, la ocasión se presta para exponer de manera explícita su postura realista (realismo conceptual), en la que es quizá la exposición más completa que se ha hecho en los tiempos modernos del platonismo en matemáticas. Dicho análisis nos permite, en la última sección del capítulo, presentar una síntesis de su pensamiento junto con algunas observaciones críticas. Capíulo 7. En el último capítulo llevamos a cabo tres tareas complementarias. En primer lugar, realizamos un balance de la obra de Hilbert y reivindicamos algunos aspectos de su concepción de la matemática con los que estamos de acuerdo. Acto seguido, examinamos lo que habría sido de la matemática en caso de que Hilbert hubiera logrado sus propósitos, y establecemos dos conclusiones: la matemática no es susceptible de una racionalización objetiva completa, ni se reduce a una mera sintaxis del lenguaje. Por último, llevamos a cabo una lectura muy general de los teoremas limitativos de Gödel, la cual apunta hacia la idea de que la matemática es una actividad creativa del hombre y, como tal, se encuentra más cerca del arte de lo que comúnmente se cree. Esto lo hacemos examinando el lugar que ocupa la noción de “verdad” en la matemática, la cual, desde nuestro punto de vista, constituye un ideal de la razón pura en el sentido de Kant, es decir, un principio regulador que da sentido a la búsqueda que la matemática representa. 33 Esto lo hizo en la llamada Gibbs Lecture, pronunciada en la Universidad de Brown, en Providence, Rode Island, en 1951. Véase (Gödel, 1951). I NTRODUCCIÓN GENERAL XXVIII Apéndices. Dada la naturaleza del tema que nos ocupa, en distintos momentos es necesario abordar algunos aspectos de las cuestiones consideradas, o ampliar la información propiamente matemática que subyace a este estudio. Al hacerlo, en muchos casos he preferido hacer lo anterior en diversos apéndices. El grado de complejidad de éstos es variable y va desde simples comentarios o ejemplos, hasta exposiciones más o menos detalladas de temas específicos. Algunos de ellos son fragmentos de otros trabajos, y uno de ellos, el apéndice 6, es continuación de la sección 2.6. En gran medida se trata de facilitar el tratamiento de diversas cuestiones en el texto principal sin detenernos en detalles técnicos o pormenores que pueden ser examinados por separado. Al respecto, quiero advertir que algunos tópicos aparecen de manera repetida en los apéndices. Esto obedece a que los materiales ahí reunidos no están organizados sistemáticamente, pues se fueron integrando, como ya lo he dicho en el prefacio, conforme a las necesidades del texto. No obstante, más allá de algunas repeticiones inocuas, dichos anexos cumplen la labor de completar el texto principal sin entorpecer su lectura. Reconocimientos Antes que nada, quiero señalar que este libro fue realizado con el apoyo del Programa UNAM-DGAPA-PAPIME clave PE103916, sin el cual quizá jamás habría visto la luz en forma impresa. El trabajo en sí tiene como origen la pertinaz insistencia, hace ya mucho tiempo, de mi amigo y colega Santiago Ramírez Castañeda, quien en diversas ocasiones me insistió en que escribiera acerca de todas esas cosas de las que solíamos conversar en su casa de Coyoacán por las tardes. Recuerdo también con agradecimiento a Juan José Rivaud Morayta por la atenta lectura y finas observaciones acerca de lo que fuera una primitiva (y más reducida) versión del mismo, y a Jaime Oscar Falcón por las innumerables ocasiones en que, sentados en torno a una taza de café, discurrimos acerca de muchos de los temas que aquí figuran, sugiriendo él algunos caminos. Aunque ninguno de los tres –Santiago, Juan José y Jaime Oscar– está entre nosotros para ver el resultado, creo que les habría complacido saber que sí accedí a sus recomendaciones y tomé en cuenta sus sugerencias (bueno, no todas). En cuanto a quienes me ayudaron más por el lado de la filosofía, debo externar mi agradecimiento, por el tiempo e interés con que revisaron algunos pasajes de este trabajo, y por sus amables sugerencias, a Pedro Stepanenko Gutiérrez y al Doctor José Antonio Robles García. A Max Fernández de Castro le debo el minucioso escrutinio de una versión muy antigua y algunos cambios propuestos por él. También quiero expresar mi reconocimiento a quienes cooperaron en la elaboración de este trabajo de diversas maneras con explicaciones, objeciones y estimulantes consejos. So pena de cometer atroces omisiones, quiero mencionar señaladamente (y en estricto orden alfabético) a José Alfredo Amor Montaño, Isabel Cabrera Villoro, Elisabetta Di Castro Stringher y Manuel Gil Antón por la ayuda recibida. De la misma manera, debo reconocer la labor de quienes, actuando anónimamente como árbitros de XXIX los diversos trabajos que sirvieron como venero de este libro, ayudaron a mejorarlo con sus valiosas observaciones. En cuanto al libro en su forma final, debo agradecer a Rafael Martínez Enriquez y Guillermo Zambrana Castañeda por las innumerables sugerencias y correcciones que hicieron en su calidad de árbitros, bajo la sospecha de que yo era el autor. Por último, quiero agradecer el apoyo recibido del Departamento de Matemáticas de la Facultad de Ciencias, sin el cual no habría llegado a la conclusión de este trabajo. En particular, quiero hacer pública mi gratitud a Tania Azucena Chicalote Jiménez por la paciente ayuda que me brindó en la edición del libro y por haber triunfado sobre mi insensatez hasta lograr tan bella presentación. Como siempre, mi reconocimiento para aquellos que hacen de la Universidad un lugar donde bien vale la pena laborar. Ciudad Universitaria, agosto de 2018 Capítulo 1 Euclides, Kant, Hilbert y los fundamentos de la geometría 1.1. Introducción En este capítulo consideramos diversas cuestiones: los Elementos de Euclides en tanto que antecedente histórico de los Grundlagen der Geometrie (Fundamentos de la geometría) de Hilbert, ciertas circunstancias que rodearon la escritura de los Grundlagen, la diferencia en los métodos de prueba en ambas obras, el punto de vista de Kant en torno a la demostración euclidiana (y por ende en torno a la naturaleza del conocimiento geométrico), el punto de vista de Hilbert en torno a la matemática pura, el modo en que Hilbert organiza y concibe los principios de la geometría en los Grundlagen (escrito en 1899), diversas circunstancias que confluyeron en la escritura de esta obra y algunos resultados alcanzados en ella. El libro de los Fundamentos de la geometría (al que nos referiremos, como ya lo hemos hecho, como “los Grundlagen”) es la obra con la que Hilbert culminó sus investigaciones en torno a los fundamentos de la geometría, una labor en la que estuvo comprometido durante más de ocho años. Durante todo ese tiempo, Hilbert debatió y dio forma y vida a múltiples ideas en torno a la naturaleza de la geometría, mismas que en su momento entraron en conflicto con la visión que tradicionalmente se había tenido de esta ciencia. A este periodo se le suele llamar etapa geométrica del formalismo de Hilbert. Una de las razones por las que el texto de Hilbert sigue siendo objeto de estudio es que en él pone en juego una nueva manera de entender la geometría pura. Se trata de ciertas ideas relativas a la naturaleza de esta disciplina que fueron cobrando vida durante la segunda mitad del siglo diecinueve. Es la misma visión que posteriormente habría de modificar y extender a toda la matemática y que evolucionó hasta alcanzar su máxima expresión en la defensa de la teoría de los números transfinitos de Cantor 1 2 1. E UCLIDES , K ANT, H ILBERT Y ... y en el llamado programa finitista de los años veinte.1 Quizá las más importantes de estas ideas son las siguientes: I. Aunque el origen de la geometría se halla en la observación de los hechos espaciales, en su forma axiomática esta teoría consiste en un entramado de conceptos. En este entramado los axiomas corresponden a ciertos hechos básicos de nuestra intuición espacial cuya forma exponen con precisión. II . Las propiedades y relaciones establecidas por los axiomas no sólo son satisfechas por los objetos espaciales que les dan origen, sino por otros sistemas de objetos de muy diversa índole. Por tanto, el despliegue de la teoría no puede apoyarse internamente en tales hechos espaciales, debiendo consistir tan sólo en la derivación de las consecuencias lógicas de los axiomas. En otras palabras, la teoría se debe desarrollar exclusivamente en función de lo que establecen los axiomas, sin tomar en cuenta la interpretación que se tenga de los términos implicados en ellos.2 Este entramado se debe investigar con relación a ciertas propiedades como lo son la completud, la independencia y la ausencia de contradicciones; y III . Los axiomas constituyen en sí una definición de los entes con que trata la teoría, es decir, los definen implícitamente.3 En particular, la existencia matemática está definida por la no contradicción. Estas ideas, producto entre otras cosas del desarrollo de la geometría en el siglo diecinueve, se pueden comprender mejor contrastándolas con el carácter, los métodos y los contenidos de la geometría clásica euclidiana y con el punto de vista de Kant. Todo lo anterior explica en gran medida los contenidos de este capítulo, el cual inicia con una reflexión en torno a los Elementos de Euclides, las técnicas de demostración utilizadas por él y una exposición de la teoría de esquemas de Kant mediante la cual este filósofo se propuso explicar el tipo de razonamiento diagramático utilizado por Euclides. En una segunda parte, el capítulo narra algunos cambios ocurridos en el tratamiento de la geometría durante el siglo diecinueve, la manera en que Hilbert aborda 1 El sentido del adjetivo “finitista” se hará claro en el capítulo 4. presentación que hace Euclides de la geometría no corresponde a esta idea. Hilbert y Bernays califican la teoría axiomática de Euclides con el adjetivo “inhaltliche” (“material”, en el sentido de que posee un contenido) para indicar que ésta expresa las propiedades y relaciones de un sistema de objetos preestablecido al que sigue ligado (v. Hilbert y Bernays, 1934, p. 2). Esto se advierte de diversas maneras. Por ejemplo, en los Elementos algunas definiciones están ahí sin otro propósito que el de dirigir nuestra atención hacia cierto orden particular de objetos, sin que éstas sean utilizadas en las demostraciones; v. gr., “Punto es aquello que ya no tiene partes (D.I.1)”. De hecho, algunos significados adscritos a los términos en la geometría euclidiana suelen jugar un papel en las demostraciones, lo cual se hace patente con el uso de diagramas y la toma de información de los mismos. De esto nos ocuparemos posteriormente. 3 Estas ideas, que forman parte de la concepción que tiene Hilbert de la matemática en general, se pueden expresar de la siguiente manera: ninguna teoría matemática, en su forma pura, constituye un conjunto de verdades acerca de algún sistema de objetos al que se encuentra indisolublemente ligado; más bien, se trata de una red o entramado de relaciones lógicas entre conceptos definidos implícitamente por los axiomas. 2 La 1.2. L A GEOMETRÍA EN LOS Elementos DE E UCLIDES 3 sus fundamentos y el modo en que la matemática moderna desbordó la teoría kantiana de esquemas. Como veremos, se trata de un periodo en el que no sólo se amplió el abanico de teorías matemáticas, sino la visión que se tenía de la lógica y la manera de pensar la matemática misma. Además, se toca una cuestión muy poco discutida con relación a los Grundlagen, a saber, la relativa a ciertos problemas propiamente matemáticos que Hilbert aborda en esta obra y la importancia de los mismos. Como veremos, se trata de la “puesta en escena” de un nuevo modo de vincular la geometría con el álgebra y del impulso de lo que posteriormente se habría de conocer como teoría de modelos en la lógica matemática. 1.2. La geometría en los Elementos de Euclides El tratado de los Elementos, escrito por Euclides alrededor del año 300 a. C., constituye un hito en la historia de las matemáticas. Su importancia e influencia se puede advertir no sólo en las matemáticas, donde por más de dos mil años se le consideró un paradigma de la ciencia deductiva, sino en áreas como la física y la filosofía, donde también dejó impresa su huella.4 Para los fines que aquí perseguimos habremos de dirigir nuestra atención a tres cuestiones de suma importancia que se entretejen en los Elementos: los métodos de prueba admitidos, cierta noción de “objeto” matemático subyacente a la teoría y diversas cuestiones relativas al sentido y significado de los axiomas. El modo en que estos tres factores se entrelazan exige entender la construcción axiomática de Euclides como algo más que un simple reordenamiento lógico de una parte del saber geométrico de su tiempo. Más bien, se trata de una tarea sometida a diversos propósitos no declarados por su autor (la obra carece de introducción, comentarios, etc.), pero que, desde nuestro punto de vista, debió tener en mente al llevarla a cabo. Por ejemplo, la ordenación del libro I y parte del libro II de los Elementos parece encaminada a esclarecer el problema de las cuadraturas. Desde esta perspectiva la proposición II.14 destaca como un punto culminante: dada cualquier figura rectilínea, siempre es posible construir un cuadrado cuya área es igual a la de ésta. Lo mismo se puede decir de lo hecho por Hilbert en los Grundlagen, cuya base axiomática se organiza con la intención de explorar los vínculos entre diversas nociones que concurren en la geometría clásica y que Hilbert considera importantes (v. gr., la incidencia, la congruencia y la continuidad), y así examinar la teoría de áreas planas de Euclides, aclarar la relación entre los axiomas y los teoremas de Desargues y Pascal y precisar el lugar que estos últimos ocupan en la “algebrización” de la geometría. Sólo así, pensando cada una de estas teorías como algo dispuesto para la investigación de ciertos problemas específicos, se puede entender el orden y la selección de conceptos primitivos, axiomas y teoremas que estos dos autores, Euclides y Hilbert, hacen en sus respectivas obras. Otra cuestión que no podemos dejar de comentar es la del significado 4 Fuera de las matemáticas, la mecánica de Newton y La ética demostrada al modo geométrico de Spinoza son ejemplos de dominios a los que se extendió el método utilizado por Euclides. 4 1. E UCLIDES , K ANT, H ILBERT Y ... histórico del texto de Euclides. La obra en sí representa un punto culminante en la marcha de la matemática griega que empezó con Tales de Mileto alrededor del 585 a. C. y prosiguió con la aritmética y geometría de Pitágoras en 540 a. C., las paradojas de Zenón cerca del 450, los Elementos de Hipócrates de Kios en el año 430, la trisectriz de Hippias en el 420, la aparición en escena de los inconmensurables por la misma época, los trabajos de Teeteto y de Eudoxio que, entre los años 400 y 360, proveyeron el material de los primeros seis libros de los Elementos, las Cónicas de Menecmo junto con la cuadratriz de Dinóstrato en el 350 y las Cónicas de Aristeo del 320. Se trata de una larga tradición que alcanzó su plenitud alrededor del 300 a. C. con la escritura de los Elementos. Aunque los textos de los autores citados son poco más que fragmentos y noticias difusas, todo apunta a un amplio desarrollo de la matemática griega del que Euclides se beneficiaría, proponiendo la escritura o recopilación de los componentes básicos, justamente elementales, de la geometría anclados en esa tradición. 1.2.1. Los postulados de Euclides y las primeras proposiciones de los Elementos Los 13 libros de los Elementos tienen como base un conjunto mínimo de axiomas, postulados y definiciones que seguramente Euclides pensó precisas. Dicho de manera concisa, se trata de la síntesis de los elementos con los que hacemos geometría, expresados estos últimos como proposiciones demostradas, es decir argumentadas y encadenadas deductivamente. Así, lo que Euclides ofrece es un tratado de geometría que abarca diversos temas y que comprende más de 450 proposiciones que se levantan a partir de un reducido número de axiomas y postulados. En lo que sigue presentamos de manera breve las técnicas constructivas, lógicas y organizativas (demostrativas) de los Elementos. En el libro I, Euclides introduce lo que podemos llamar propiamente los axiomas y postulados; en total son diez y están divididos en dos grupos, el de los “postulados” y el de las “nociones comunes”. Son los siguientes: Postulados P.1 Postúlese el trazar una línea recta desde un punto cualquiera hasta otro punto cualquiera. P.2 Y el prolongar continuamente una recta finita en línea recta. P.3 Y el describir un círculo con cualquier centro y distancia. P.4 Y el ser todos los ángulos rectos iguales entre sí. P.5 Y que si una recta al incidir sobre dos rectas hace los ángulos internos del mismo lado menores que dos rectos, las dos rectas prolongadas indefinidamente se encontrarán en el lado en el que están los (ángulos) menores que dos rectos. 1.2. L A GEOMETRÍA EN LOS Elementos DE E UCLIDES 5 Nociones comunes N.C.1 Las cosas iguales a una misma cosa son también iguales entre sí. N.C.2 Y si se añaden cosas iguales a cosas iguales, los totales son iguales. N.C.3 Y si de cosas iguales se quitan cosas iguales, los restos son iguales. N.C.4 Y las cosas que coinciden entre sí son iguales entre sí. N.C.5 Y el todo es mayor que la parte. Como se puede ver, el primer grupo establece explícitamente el conjunto de suposiciones relativas a objetos que identificamos desde el conocimiento común matemático como objetos geométricos y que son, por lo menos en parte, reglas claras de la manera en la que pueden y deben manipularse éstos. Vale la pena señalar que los dos grupos de axiomas no serán modificados ni sufrirán adiciones a lo largo de la obra. Por el contrario, la lista de definiciones habrá de extenderse en su desarrollo, dada la necesidad de introducir nuevos objetos de acuerdo con los distintos temas a tratar.5 En el primer libro se establecen veintitrés definiciones de los objetos básicos de la geometría. Las siguientes son algunos ejemplos: D.1 Punto es lo que no tiene partes. D.2 Una línea es una longitud sin anchura. D.3 Los extremos de una línea son puntos. D.4 Una línea recta es aquella que yace por igual respecto de los puntos que están en ella. D.10 Si una línea recta cae sobre otra formando ángulos adyacentes iguales, cada ángulo se dice que es recto y las líneas perpendiculares entre sí. D.15 Un círculo es una figura plana contenida por una línea tal que todas las líneas que caen de ella a un punto que se encuentra al interior de la figura son iguales entre sí. D.16 Y tal punto se llama centro del círculo. 5 Los postulados son proposiciones que se admiten, o se requiere que sean admitidas, para hacer posible la demostración. En los Elementos los tres primeros se relacionan con la construcción de líneas y círculos conforme a ciertos procedimientos. Por su parte, las nociones comunes son principios del conocimiento demostrativo propios del entendimiento, sirviendo ante todo como elementos que son utilizados en las demostraciones. A diferencia de los postulados, las nociones comunes son vistas como principios esenciales de la inteligencia humana, como un patrimonio común de todos los humanos por el simple hecho de tener inteligencia, y su aceptación no tiene que ser “pedida” como en el caso de los postulados. 6 1. E UCLIDES , K ANT, H ILBERT Y ... D.17 Diámetro del círculo es una recta cualquiera que se traza por su centro y cuyos extremos están en la circunferencia del círculo. Tal recta biseca al círculo. D.23 Son rectas paralelas las que estando en el mismo plano y siendo prolongadas indefinidamente en ambos sentidos, no se encuentran una a otra en ninguno de ellos. En las restantes definiciones se especifican los demás objetos básicos: superficie, plano, figura, ángulo, ángulo recto, ángulo agudo, ángulo obtuso, perpendicular, triángulo, cuadrado, paralelogramo, rectángulo, etc. Debemos notar que estos objetos están definidos de tal manera que claramente se les debe considerar como objetos construidos por el intelecto y desprovistos de un carácter sensorial. Este hecho contrasta, y de aquí la importancia de considerarlo, con la construcción de objetos visuales que los representan, el uso de diagramas y el manejo que hace Euclides de recursos que se antoja llamar empíricos en los procesos de demostración, y por lo tanto de construcción y organización de la geometría elemental.6 ¿Cómo empieza la geometría en los Elementos? Veamos las tres proposiciones iniciales del texto a fin de alcanzar algunas conclusiones en la medida en la que uno puede considerar que las tres juntas apuntan a la solución de un mismo problema. Estas proposiciones muestran de manera paradigmática el proceso de demostración y encadenamiento deductivo que es la marca de Euclides. En esta presentación, las demostraciones de las proposiciones I.2 y I.3 no las repetimos de manera textual, pues en aras de mayor claridad las hemos simplificado conservando el argumento euclidiano.7 6 En esta parte del texto manejamos con cierta soltura los términos “prueba” y “demostración”, cual si fueran sinónimos. Estrictamente hablando, hay una gran diferencia en su significado, aunque hoy en día ésta tiende a borrarse. Conviene hacer un par de aclaraciones. En general, una prueba es un procedimiento aceptado por una comunidad para establecer un saber, es decir, un conocimiento válido. En cambio, una demostración es un argumento deductivo mediante el cual se deriva una proposición a partir de hipótesis. Al respecto pueden constituir pruebas cosas como mostrar ad oculos (ante la vista) una cosa o hecho, exhibir un documento, aportar un testimonio (derecho), efectuar una inducción (v. gr., en medicina), etc. Todo depende del acuerdo al que se haya llegado respecto a qué constituye y qué no constituye una prueba. Con relación a las “demostraciones” que ofrece Euclides en los Elementos, estas no constituyen tales cosas en el estricto sentido que acabamos de señalar (esto lo veremos en esta y la siguiente sección). 7 En las versiones más antiguas de los Elementos no hay ninguna referencia a las demostraciones, ni siquiera un nombre. Con el paso del tiempo, para hacer más legibles los argumentos (las “pruebas” o “demostraciones”), se volvió costumbre añadir diversas indicaciones. Por ejemplo, poner como encabezado la palabra “demostración”, aunque el argumento no lo sea en el sentido ya señalado. Al respecto, nosotros no pondremos ninguna indicación. Algunas otras indicaciones que se suelen incorporar son las siguientes. Tesis: aquello que hay que construir o probar en cada caso; P.N. Postulado N; N.C.n. Noción común n; D.N.n. Definición número n del libro N; Prop,N.n: Proposición n del libro N. Por último, el fin de la prueba o construcción nosotros lo indicamos con el símbolo “ ”. 1.2. L A GEOMETRÍA EN LOS Elementos DE E UCLIDES 7 Proposición I.1 Construir un triángulo equilátero sobre una recta finita dada. Sea AB la recta delimitada dada. Hay que construir sobre AB un triángulo equilátero (Tesis). Con centro en A y radio AB descríbase un círculo, el BGD; y con centro en B y el radio BA descríbase el círculo AGE. (P.3) Ahora, desde el punto G en que se cortan tales círculos, trácense las rectas GA y GB. (P.1) Dado que el punto A es centro del círculo GDB, la recta GA es igual a la AB; Y dado que el punto B es centro del círculo GAE, la recta GB es igual a la AB; Luego las rectas GA y GB son iguales entre sí, pues cosas iguales a una y la misma cosa son también iguales entre sí (N.C.1) Por tanto, las tres rectas GA, GB y AB son iguales entre sí. Según esto, pues, el triángulo ABG es equilátero. (D.I.20) Y está además construido sobre la recta delimitada dada AB. Que es lo que se quería hacer. Para construir el triángulo equilátero sobre la recta finita dada AB se trazan o “producen” los círculos BGD y AGE con centros respectivos A y B, y se unen los puntos AG y BG con las rectas respectivas. En este caso, como en prácticamente el resto de la obra, la recta AB se considera un representante de cualquier recta, por lo que se estima que la proposición es de carácter general, tal como se había enunciado desde el principio. Algunos comentarios relevantes. Como se puede apreciar, la lógica de la demostración transita por el uso “natural” de una serie de inferencias directas como, por ejemplo, las correspondientes al modus ponens, que Euclides no explicita previamente y que aplica a enunciados que sólo son definiciones, postulados, nociones comunes o proposiciones ya demostradas. Sin embargo, es importante notar que en este caso se supone que las dos circunferencias se intersecan en un punto G, lo que permite trazar las rectas AG y BG. Se trata de algo claramente sugerido por el dibujo. Esto le confiere a la evidencia visual derivada del diagrama la cualidad de volverse parte del argumento. Como veremos, en estricta lógica se está añadiendo un postulado que en rigor habría que haberlo explicitado de antemano. No obstante, difícilmente se puede pensar que se trata de una falla lógica; más bien, el modo de proceder de Euclides revela un tipo particular de práctica matemática o un aspecto de lo que era la “intuición matemática” en ese período, algo que puede considerarse como un componente del “sentido común matemático” de la época. Más adelante volveremos a este punto. 8 1. E UCLIDES , K ANT, H ILBERT Y ... Veamos la segunda proposición. Proposición I.2 Poner en un punto dado (como extremo) una recta igual a una recta dada. En este caso se trata de “mover” a la recta BG al punto A de tal manera que éste sea extremo de la recta “trasladada”. Para esto: Se trazan la recta AB (P.1) y el triángulo equilátero ABD (Prop.1); se prolongan DA y DB indefinidamente (P.2), y con centro en B y radio BG se traza el círculo HGT . Por su construcción, BH = BG (son radios del mismo círculo, D.15) Con centro en D y radio DH se traza el círculo HKL, de modo que DH = DL (son radios del mismo círculo) Pero como DA = DB, tenemos que AL = BH y, por lo tanto, BG = AL, y este último segmento tiene a A como extremo, que es lo que se quería hacer. Hacemos notar que la demostración nos lleva a reconocer que los compases euclidianos no son una herramienta física, pues no se les utiliza para medir ni para trasladar medidas. Su uso se limita a las posibilidades establecidas en los postulados y las nociones comunes. En otras palabras, el problema planteado en esta proposición no es un problema práctico; si lo pensamos como tal, bastaría abrir el compás, aún hipotético, al tamaño de la recta y “trasladarla” a cualquier punto. Esto apunta al carácter propiamente matemático de los temas tratados. Veamos la tercera proposición: Proposición I.3 Dadas dos rectas desiguales, quitar de la mayor una recta igual a la menor. 1.2. L A GEOMETRÍA EN LOS Elementos DE E UCLIDES 9 Supongamos a la recta G menor que la recta AB. En tal caso habrá que quitar de AB una recta igual que G. Póngase la recta AD = G en el punto A como extremo (P.2) Con centro en A y radio AD trácese el círculo DEZ. Como AE = AD (D.15), entonces AE = G, que es lo que se quería hacer. Del análisis de estas tres proposiciones podemos extraer las siguientes observaciones: La tercera resuelve un problema relevante, a saber, cómo poner una recta sobre otra, garantizando que podemos hacer coincidir, si fuera el caso, distintas figuras para comprobar su igualdad de acuerdo con la noción común N.C.4. Además, se observa con claridad la dependencia lógica que se establece entre las tres proposiciones y el conjunto de definiciones, postulados y axiomas. La proposición I.3 depende de haber demostrado la I.2 que depende de la I.1, mientras que esta última sólo depende de las definiciones, los postulados y las nociones comunes. De este modo podemos observar cómo, además del encadenamiento lógico y la técnica de la demostración, hay un afán organizativo que le confiere sentido al contenido específico de cada proposición. Es decir, cada proposición cumple con un propósito en un esquema amplio que supone un sentido de construcción y organización. Como el lector lo podrá constatar, este principio se reitera a lo largo de la obra. Con respecto a esto último, vale la pena señalar que, como destaca el propio Euclides, se trata de tres problemas, esto es, de tres proposiciones que tienen como objetivo hacer algo, a diferencia de las proposiciones denominadas teoremas, las cuales establecen una propiedad de índole general acerca de los objetos con los que tratan. Adelantamos aquí que esta diferencia no es banal, pues apunta a una diferencia esencial para entender los aspectos organizativos de los Elementos.8 Veamos un conjunto de proposiciones que ilustran lo anterior; éstas van de la proposición cuatro a la diez y pertenecen al libro I: Proposición I.4 Si dos triángulos tienen dos lados de uno iguales a dos lados del otro y tienen iguales los ángulos comprendidos por las rectas iguales, tendrán también las respectivas bases iguales, y un triángulo será igual al otro, y los ángulos restantes, a saber, los subtendidos por los lados iguales, serán también iguales respectivamente. En este caso omitimos la demostración para concentrarnos en el resto de las propo8 El propio Euclides marca una diferencia entre las proposiciones que tienen como objetivo construir algo y las proposiciones en que se prueba algo, escribiendo al final de ellas “que es lo que se quería hacer” en un caso y “que es lo que se quería probar” en el otro. En algunos textos se suelen escribir los acrónimos QEF (correspondiente al latín quod erat faciendum) y QED (correspondiente al latín quod erat demonstrandum). No obstante, la frase utilizada por Euclides en el texto original era ǒπερ ε̌δ ει πoι η̃σ αι, la cual significa, conforme a Wikipedia (ficha Q.E.D. en inglés), “la misma cosa que se requería mostrar o probar”. 10 1. E UCLIDES , K ANT, H ILBERT Y ... siciones de este grupo. Baste decir que es el primer teorema del texto, en el cual se establece el conocido criterio lado-ángulo-lado de igualdad de triángulos. Esta proposición resulta un elemento clave en la demostración del siguiente teorema: Proposición I.5 En los triángulos isósceles los ángulos de la base son iguales entre sí, y prolongadas las dos rectas iguales, los ángulos situados bajo la base serán iguales entre sí. Sea ABG un triángulo isósceles tal que AB = AG, y sean AD y AE las respectivas prolongaciones de esos lados. Sea Z un punto cualquiera sobre AD y sea GH sobre AE tal que GH = BZ. Únanse Z con G y H con B, entonces: Como AZ = AH, AB = AG y ∠ZAH es común, AZG = AHB (Prop.I.4), y serán iguales el lado restante y los ángulos correspondientes restantes: BH = ZG, ∠ABH = ∠AGZ y ∠AZG = ∠AHB. También, de lo anterior, GH = BZ, BH = ZG y ∠BZG = ∠GHB, por lo que BZG = BHG (I.4), ∠GBH = ∠BGZ y ∠ZBG = ∠HGB (que es parte de lo que se quería demostrar). Además, ∠ABH − ∠GBH = ∠AGZ − ∠BGZ; por lo tanto, ∠ABG = ∠AGB, que es lo que se quería demostrar. En este caso la demostración se lleva a cabo mediante una inferencia directa, haciendo uso del teorema anterior y de definiciones, postulados y nociones comunes. La proposición seis establece el teorema recíproco de éste. La proposición siete es de nuevo un teorema. En este caso es notable el uso, por primera vez en el texto, de una regla de inferencia distinta: la reducción al absurdo. De nueva cuenta ésta aparece con naturalidad y a partir de aquí se vuelve un recurso habitual de demostración. Proposición I.7 No se podrán levantar sobre la misma recta otras dos rectas iguales respectivamente a dos rectas dadas, de modo que se encuentren en dos puntos distintos por el mismo lado y con los mismos extremos que las rectas dadas. 1.2. L A GEOMETRÍA EN LOS Elementos DE E UCLIDES 11 Sean los triángulos AGB y ADB sobre la base AB tales que AG = AD y BG = BD. Queremos demostrar que G y D son el mismo punto. Supongamos que G y D son distintos. Trazando la recta GD resulta que los triángulos GAD y GBD son isósceles (D.I.5), de modo que: ∠BGD = ∠BDG y ∠ADG = ∠AGD Por otra parte, ∠BDG > ∠ADG y ∠AGD > ∠BGD (véase la figura) de modo que ∠BDG > ∠ADG = ∠AGD > ∠BGD = ∠BDG, lo que es imposible. Por lo tanto, G y D coinciden, que es lo que se quería demostrar.9 Vale la pena destacar que junto con una lógica que para nosotros resulta familiar, se recurre a la figura para obtener los argumentos que conducen a la contradicción, y por lo tanto, a la conclusión final (v. gr., de ella se toma el dato de que ∠BDG es mayor que ∠ADG). Desde una perspectiva contemporánea, donde el rigor lógico se ha convertido en algunos casos en una exigencia extrema, esta práctica parece inadecuada. Un asunto a discutir es el grado de aceptación que los recursos de este tipo siguen teniendo en la práctica matemática. Pronto volveremos a este punto. La siguiente proposición, encadenada con la anterior, establece el criterio lado-ladolado para la igualdad de triángulos. Proposición I.8 Si dos triángulos tienen dos lados del uno iguales respectivamente a dos lados del otro y tienen también iguales sus bases respectivas, también tendrán iguales los ángulos comprendidos por las rectas iguales. La prueba de ésta se hace a partir de suponer que si coinciden las bases BG y EZ y el punto A no coincide con el punto D, siendo AB = DE y AG = DZ, tendría que existir un punto como H = D, pero esto nos llevaría al caso que ya fue demostrado como imposible en la proposición anterior. En el caso de las proposiciones I.4-I.8 podemos constatar que el contenido específico de ellas es importante y constituye un conocimiento sin el cual difícilmente podría abordarse el estudio de la geometría, así fuera muy elemental; además, es relevante el encadenamiento lógico que se mantiene y que marcará al resto de los Elementos. De hecho, es esta forma de encadenamiento lo que se conoce como exposición sintética 9 Este argumento es similar al que ofrece Euclides en los Elementos y procede de la misma manera, por reducción al absurdo. La conclusión es la misma en ambos casos. 12 1. E UCLIDES , K ANT, H ILBERT Y ... de la geometría: a saber, un montaje que parte de definiciones, postulados, nociones comunes, proposiciones ya demostradas y reglas de inferencia claramente reconocibles. Lo anterior no es, sin embargo, todo lo que se puede decir de los Elementos. Las dos proposiciones siguientes, así como la proposición I.3 ya vista, revelan un aspecto organizativo presente que no es de carácter estrictamente lógico, y que atañe a la presentación y acomodo de las proposiciones de manera coherente. Parece pertinente preguntarse por la elección de las proposiciones que constituyen el corpus euclidiano, y porqué otras proposiciones quedaron fuera. La consideración de las siguientes proposiciones nos permite reflexionar en torno a los presupuestos organizativos del texto. Proposición I.9 Dividir en dos partes iguales un ángulo rectilíneo dado. La demostración de esta proposición, que es un problema, hace ver que en la figura los triángulos ADZ y AEZ son iguales en virtud del teorema demostrado en la proposición anterior y que, por lo tanto, los ángulos DAZ y EAZ son iguales, de manera que la recta AZ ha dividido en dos al ángulo BAG. Proposición I.10 Dividir en dos partes iguales una recta finita dada. Esta proposición se demuestra con base en la proposición I.4, la cual permite establecer la igualdad de los triángulos GAD y GDB, lo que implica la igualdad de las bases y por lo tanto la división de la recta finita dada AB en dos partes iguales por el punto D. 1.2. L A GEOMETRÍA EN LOS Elementos DE E UCLIDES 13 Estas dos proposiciones tienen el carácter de problemas y una vez establecidas pasan a formar parte de conocimiento básico de la geometría. Desde la perspectiva que nos ocupa resulta importante consignar, de nuevo, la dependencia lógica con las proposiciones anteriores y la organización sintética de los contenidos específicos. Como en el caso de la proposición I.3, podemos ver un patrón emergente, a saber, la combinación de teoremas y problemas de manera que unos y otros “componen” conocimientos que no sólo establecen propiedades generales, sino que también resuelven problemas que permiten la demostración de nuevos teoremas que permiten la solución de nuevos problemas, etc. En otras palabras: no se trata, como podría pensarse, de un arreglo en el que lo único relevante es el orden y el encadenamiento lógico. Por el contrario, desde nuestra perspectiva podemos advertir problemas que seguramente la tradición consideraba importantes y que con seguridad determinaron el contenido de cada uno de los libros. Veamos un caso relevante, esta vez relacionado con la proposición catorce del libro II, la cual cae en la categoría de problema. Proposición II.14 Construir un cuadrado igual a una figura rectilínea dada. Veamos la idea general de la prueba. La proposición I.47 (teorema de Pitágoras)10 permite construir paralelogramos con la misma área que cualquier figura rectilínea dada (A en la figura), de modo que al realizar esta construcción, si el paralelogramo resultante (BGDE en la figura) es un cuadrado, el problema quedará resuelto; si no, por la proposición cinco del libro II es posible construir la recta BZ, con ED = EZ, cortada en H y en E de tal manera que (BE)(EZ) + EH 2 = HZ 2 . Pero HZ = HT y por lo tanto, (BE)(EZ) + EH 2 = HT 2 . Ahora bien, por el teorema de Pitágoras, ET 2 + EH 2 = HT 2 , i. e., (BE)(EZ) + EH 2 = 10 Proposición I.47. En los triángulos rectángulos el cuadrado del lado que subtiende al ángulo recto es igual a los cuadrados de los lados que comprenden el ángulo recto. Desde la perspectiva que nos ocupa, el teorema de Pitágoras nos brinda un procedimiento para sumar (cuadrar) dos cuadrados dados, es decir, para construir un cuadrado cuya área es igual a la de estos últimos. 14 1. E UCLIDES , K ANT, H ILBERT Y ... ET 2 + EH 2 , y como EZ se ha construido igual a ED : Paralelogramo BD = A = HT 2 , que es lo que se quería hacer. La solución de este problema no es una cuestión menor; indica lo que puede lograrse con regla y compás respecto de las cuadraturas: por lo pronto, es posible cuadrar figuras rectilíneas (hoy sabemos de la imposibilidad de cuadrar el círculo con regla y compás). Además, resulta notable cómo la solución de este problema depende de dos de las proposiciones más importantes del libro I, una de las cuales es, quizás, la proposición más conocida de la geometría; y no sólo esto: el análisis de la cadena de dependencias lógicas de la proposición II.14 muestra que cerca del 75 % de las proposiciones del libro I están involucradas. Lo anterior sugiere que la organización euclidiana de la geometría no responde simplemente a consideraciones lógicas, sino que va de la mano, o incluso domina, el gusto y la necesidad de resolver problemas con la construcción sintética del contenido específico de las proposiciones. Valga la insistencia: los Elementos sólo pueden leerse desde esta triple perspectiva que revela el genio del autor y que diera fundamento hace más de 2300 años a la disciplina a la que nos dedicamos. En la sección I.3 abordaremos un importante aspecto de la obra de Euclides, a saber, las técnicas demostrativas que él utiliza y que habrían de servir como un modelo de rigor y claridad durante más de dos mil años. Esto nos permitirá entender por contraste el espíritu de la matemática contemporánea, la cual difiere radicalmente de la tradición en este punto. 1.2.2. Algunos comentarios 1. Comenzamos con diversas observaciones en torno al carácter de los objetos geométricos en los Elementos, el horizonte cultural en que se inscribe esta obra, el uso y función de las nociones comunes, el sentido de las proposiciones geométricas y la condición de los postulados. a) Euclides define explícitamente un conjunto de objetos geométricos fundamentales –punto, línea, superficie– con palabras llanas porque ante los ojos del entendimiento, e incluso ante la vista, tales objetos se presentan clara y distintamente. Su existencia no está a discusión ni es puesta en duda. En esto radica una de las diferencias fundamentales con la forma moderna del método axiomático (v. gr., con la forma que le da Hilbert en su libro Fundamentos de la geometría de 1899). b) Sin entrar en detalles diremos que en el mundo helénico, en el que se sitúan los Elementos, lo positivo era el estado de finitud. La infinitud equivalía a la indefinición o indeterminación y pasaba, por consiguiente, como imperfección a superar. Este pavor al infinito y a lo indeterminado parece haber llevado a Euclides a circunscribir un horizonte dentro del cual pudiera el espíritu griego sentirse seguro y ver tranquilamente las cosas. Para ello comienza por definir 1.2. L A GEOMETRÍA EN LOS Elementos DE E UCLIDES 15 explícitamente los elementos que sirven para delimitar y “finitizar” las cosas que habrán de poblar el espacio geométrico. Así, por ejemplo, los puntos limitan por extremos a las líneas, haciéndolas claras y visibles. A su vez, las líneas ejercen la función de limitar o ser los extremos de una superficie, con lo que hacen que la superficie resulte clara y distintamente visible, pudiéndose decir lo mismo de las superficies con relación a los sólidos. Por ejemplo, el concepto de segmento no existe en la geometría griega, es decir, no existe la idea de que la línea, infinita por naturaleza, ha sido fragmentada por dos puntos. Al contrario, es la línea infinita la que está en estado de imperfección, pues es una línea sin puntos que la delimiten, y la función de los puntos es precisamente la de corregir ese defecto.11 c) Según parece, parte del plan de la geometría euclidiana consiste en construir objetos delimitados que resulten visibles y se puedan abarcar con la vista, para así poblar el mundo geométrico. Esta idea de finitud se hace presente en las definiciones que figuran en los Elementos, como la definición 14, que dice: “Figura es lo comprendido por un límite o por varios”; y en las proposiciones mismas (teoremas), que tratan de figuras en este preciso sentido (triángulos, rectángulos, paralelogramos, círculos, rectas, esferas, poliedros, etc.), es decir, de figuras siempre bien circundadas por límites.12 d) Las nociones comunes son, en la concepción helénica, principios del conocimiento demostrativo propios del entendimiento. Esto significa que su justificación no tiene como base la evidencia externa, sino la interna. Estas nociones son tan fundamentales que no sólo intervienen en la geometría, sino en varias otras ciencias (p. ej. la astronomía y la lógica) e incluso en la vida práctica, y se les puede usar con la misma seguridad que los órganos sensibles. Se les llama “comunes” porque pertenecen a todos, o, al menos, son de tal naturaleza que cualquiera puede apropiarse de ellas y usarlas como suyas, bajo la idea de que hay un acuerdo global sobre su validez. Aristóteles se refiere a ellas como axiomas, usando al parecer el mismo vocablo que Pitágoras, habiendo sido los estoicos los primeros en utilizar la expresión “nociones comunes”.13 11 De este horror al infinito y a lo indeterminado casi nada queda en la geometría actual, que, por el contrario, pareciera tomarlos como punto de partida. Por ejemplo, en la geometría analítica, una línea recta es simplemente el conjunto de soluciones de una ecuación de la forma ax + by + c = 0, donde lo más relevante respecto a ella es precisamente la indeterminación de sus variables. En cuanto a la ecuación, ningún valor concreto de las variables (ningún punto) tiene un privilegio especial. Poner dos puntos en la recta para delimitar un segmento carece en sí de valor, y equivale a la operación ordinaria de dar valores específicos a las variables. 12 El abandono de la norma helénica de llamar “figura” solamente a los objetos geométricos que están cerrados y comprendidos por límites fue algo tardío, y está relacionado con la admisión de curvas arbitrarias representadas por ecuaciones y la introducción de procesos infinitos como el paso al límite. De las curvas fractales ni hablar. 13 El conocimiento que tenemos de los Elementos es a través de traducciones al árabe y versiones en griego muy posteriores a la época en que vivió Euclides. Entre los varios escritos hay ciertas diferencias 16 1. E UCLIDES , K ANT, H ILBERT Y ... e) Además de su función instrumental, las nociones comunes desempeñan en el aparato euclidiano una función lógica, y pueden intervenir en las demostraciones de dos maneras: como premisas de un argumento. Por ejemplo, Cosas iguales a una y la misma cosa son iguales entre sí (N.C.1, primera premisa). Las cosas A y B son iguales a la cosa C (segunda premisa) luego, las cosas A y B son iguales entre sí (conclusión). II como argumentos no proposicionales, en los que la noción común no es una de las premisas, sino todo el argumento y establece relaciones de igualdad o desigualdad entre las cosas. Por ejemplo, A es igual a B (primera premisa) B es igual a C (segunda premisa) luego, A es igual a C (conclusión). Al final del apéndice A el lector hallará un comentario más extenso acerca de las técnicas de demostración que utiliza Euclides. I f ) Tal como fueron entendidas es su momento, las proposiciones que figuran en los Elementos son plenamente significativas y verdaderas, pues estas se infieren de postulados que son evidentes. Dichas proposiciones se dividen (como ya lo hemos dicho) en dos clases: constructivas y demostrativas. Las proposiciones de la segunda clase afirman o niegan algo de alguna cosa (v. gr., la proposición I.6: Si dos ángulos de un triángulo son iguales, los lados subtendidos bajo tales ángulos serán también iguales). En este sentido, las proposiciones demostrativas no enuncian atributos de objetos hipotéticos, sino que ponen al descubierto las propiedades de una sustancia cuya realidad es innegable y son, por ello, verdaderas. g) Desde el punto de vista de la lógica, un postulado es una proposición que se admite, o se requiere sea admitida, a fin de hacer posible una demostración. Respecto a su utilización por parte de Euclides, en la actualidad hay dos puntos de vista divergentes en cuanto a su propósito. Son los siguientes: El primero sostiene que, a diferencia de las nociones comunes que deben ser admitidas por necesidad, los postulados expresan lo que se quiere admitir y conciernen a la existencia de determinados elementos geométricos. Así, por ejemplo, el postulado 1, “Trazar una línea recta desde un punto cualquiera a otro punto cualquiera” asienta la existencia de líneas rectas. Esta necesidad se debe, entre otras cosas, a que la definición de “línea recta” no demuestra o proclama su existencia, pues lo único que hace es declarar su esencia.14 que dejan ver que su contenido fue modificado con el paso del tiempo, por lo que no podemos decir que la expresión “nociones comunes” sea la utilizada por él. De la vida de Euclides casi no tenemos noticias, salvo que vivió en Alejandría alrededor del año 300 a. C., y que allí fundó una escuela en la que Apolonio habría de pasar algún tiempo años más tarde. En cuanto a los Elementos, no sabemos cuál fue la forma exacta que les dio. 14 Por ejemplo, la definición de unicornio como “animal con figura de caballo y un cuerno recto en la 1.2. L A GEOMETRÍA EN LOS Elementos DE E UCLIDES 17 El segundo sostiene que, en contra de lo dicho en el inciso anterior, la construcción no es para el matemático griego un medio de hacer existir los objetos geométricos (no es una “prueba de existencia”, como decimos ahora), sino que tiene como propósito hacer visible aquello que no lo es de inmediato. Por ejemplo, en el postulado 1, el “visual” Euclides postula (pide) aquello que la intuición no le proporciona sin más: trazar una línea recta de un punto a otro punto para que éstos, los puntos, dejen ver un objeto bien definido que no surge de las definiciones. Algo semejante se puede decir de los postulados 2 y 3. Por ejemplo, en el postulado 3 Euclides pide convertir cada punto en el centro de la figura perfecta por excelencia, el círculo, y hacer de cada recta el radio de la figura perfecta. En breve: con los postulados Euclides pide que aceptemos cosas que visualmente no están dadas como, por ejemplo, que dos rectas que cumplen con ciertas condiciones se cortarán al ser prolongadas al infinito (postulado 5), o que todos los ángulos rectos que construyamos serán iguales entre sí (postulado 4). Éste sería nuestro punto de vista. 2. En un excelente texto de Ian Muller, (Mueller, 1969), podemos hallar un sobresaliente comentario relativo al carácter de la demostración euclidiana, en el que dicho autor difiere radicalmente de quienes sostienen que los Elementos constituyen una obra maestra en la aplicación de la lógica a la matemática (como sucede, por ejemplo, en la Wikipedia, ficha Euclid’s Elements, 29 de marzo de 2015). Tras observar que en general Euclides trabaja directamente con las figuras, con las que realiza operaciones y en las que centra sus argumentos, Mueller concluye que la demostración euclidiana no es sino un “experimento mental” que comprende un objeto físico idealizado representado en el diagrama. Y si bien en ocasiones el diagrama no es esencial para el argumento, pues las solas palabras constituirían una prueba, el papel que en general desempeña el diagrama lo lleva a decir que su utilización no es un mero desliz, sino un indicativo del carácter experimental (visual) de la geometría de Euclides. Esto significa que, en opinión de Mueller, los diagramas euclidianos tienen más importancia en las pruebas que las palabras que van junto con ellos. Al respecto sostiene que, como en el caso del diálogo de Sócrates con el esclavo en el Menón, en los Elementos es obvio que el argumento verbal es sólo un acompañante de la manipulación diagramática y que el diagrama es tanto una fuente de convicción, como una corte a la que uno puede recurrir en última instancia para decidir la verdad o falsedad de una aseveración geométrica. Esto aleja a las pruebas euclidianas del rigor matemático tal como éste se presenta en algunos dominios de la matemática moderna (de esto hablaremos en la sección 1.3). Mueller añade que si bien dichos experimentos mentales se limitan a acuerdos preliminares (primeros principios) relativos a la naturaleza de los objetos, a mitad de la frente” sólo fija aquello que hace de un animal un unicornio, mas no dice nada acerca de su existencia. 18 1. E UCLIDES , K ANT, H ILBERT Y ... algunas de sus propiedades, y a las operaciones que se pueden llevar a cabo con ellos, no por ello pierden las deducciones euclidianas su carácter extralógico. Por tanto, la geometría de Euclides no cumple con deducir las proposiciones a partir de los axiomas y postulados conforme a los principios de la lógica.15 En su opinión, decir que tanto Euclides como Hilbert utilizan el método axiomático sólo sirve para oscurecer las muy significativas diferencias entre ambos autores. 3. Algunas observaciones y comentarios de Thomas L. Heath. Consideremos algunas opiniones de Sir Thomas L. Heath, un académico inglés especialista en matemáticas griegas, vertidas en (Heath, 1921) y (Euclides, 1926). La primera de ellas es la relativa al uso del término “elementos” en el nombre de la obra. Heath nos remite a Proclo, un filósofo neoplatónico griego que en el siglo V de nuestra era comentó ampliamente algunos pasajes de los Elementos. Según esto, hay en la geometría ciertos teoremas principales que actúan frente a los demás resultados como principios que todo lo impregnan, ofreciendo pruebas de muchas propiedades. Tales teoremas son denominados elementos, y su función se puede comparar con la de las letras del alfabeto respecto al lenguaje.16 El sentido preciso de este término es el de aquello en lo que, siendo más simple, se divide lo compuesto. En particular, los postulados serían los elementos de todo lo demás. Desde esta perspectiva, el libro de los Elementos de Euclides lo debemos entender como una recopilación de las componentes básicas de la geometría plana y del espacio. Al respecto, nos dice Heath, desde la antigüedad se ha reconocido el mérito de Euclides de evitar todo lo superfluo y seleccionar cuidadosamente sólo aquello que en verdad envuelve a la geometría en forma clara y concisa. Hasta la aparición de los Fundamentos de la geometría de Hilbert en 1899, los Elementos fueron reconocidos como superiores a todos los tratados de su tipo. Su claridad y perfección orgánica están aseguradas por la progresión que va de lo más simple a lo más complejo y por el fundamento de la investigación en nociones comunes y principios que reflejan con toda claridad la naturaleza de las cosas que se indagan. Como apoyo a sus afirmaciones Heath cita a Proclo, seguidor de Platón, quien sostiene que Euclides persigue dos propósitos en los Elementos. El primero tendría que ver con aquello que se investiga y consiste en arribar al estudio de los cinco 15 El término utilizado por los griegos para la noción de prueba o demostración era “deíknymi (δ ε ίκν ῡ μ ῐ)”. Este tenía básicamente tres significados: i) mostrar, hacer ver, poner ante los ojos; ii) dar a conocer, explicar, hacer saber por medio del lenguaje; iii) probar, demostrar. Según Luis Vega en (Vega, 1985), de quién hemos extraído esta información, los dos primeros usos parecen ser primigenios. Posteriormente, en los siglos IV y III a. C., apareció el término “apodeíknymi” para indicar la argumentación lógicamente concluyente o estrictamente demostrativa. En el Wiktionary al término “deíknūmi” le atribuyen los siguientes significados: 1) Yo muestro, señalo; 2) Yo despliego, traigo a la luz, retrato, represento; 3) Hago saber, explico, enseño, pruebo. 16 En griego, las letras del alfabeto se designan con la palabra “elementos”. 1.2. L A GEOMETRÍA EN LOS Elementos DE E UCLIDES 19 sólidos platónicos. El segundo propósito tendría que ver con el aprendizaje de la geometría. Desde esta perspectiva, los Elementos se pueden describir como un medio para perfeccionar la comprensión del resto de la geometría por parte del aprendiz, pues a partir de estos elementos se puede adquirir el conocimiento de las otras partes de esta ciencia, mientras que sin ellos es imposible formarse una idea de un tema tan complejo (el conocimiento del resto es inalcanzable). Así, los Elementos serían una recolección ordenada de aquellos teoremas que, cual principios y primeras hipótesis, participan en la construcción de todo el edificio geométrico. Como prueba de lo anterior se puede apelar a la manera en que Arquímedes se sirve de los Elementos en el estudio de la esfera y el cilindro, o Apolonio en el estudio de las cónicas, donde los teoremas que figuran en dicha obra son claramente utilizados como principios constituyentes.17 En cuanto al contenido de los Elementos, Heath señala que Euclides no muestra ningún reclamo de originalidad. El valor agregado por él atañe a los cambios introducidos en el arreglo de los temas (respecto a sus antecesores), la distribución del material y la invención de nuevas pruebas allí donde eran inadecuadas las viejas demostraciones. En su opinión, el fino orden del que hace gala Euclides en los Elementos hace de su exposición de la geometría algo muy cercano a la perfección, lo cual lo enaltece como un formidable profesor de la materia.18 Lo anterior lo expresa con las siguientes palabras: “Este maravilloso libro, con todas sus imperfecciones, las cuales son sumamente leves si se toma en cuenta la fecha en que se compuso la obra, es, y de seguro lo seguirá siendo, el más grande libro de texto de todos los tiempos. Quizá ningún otro libro, salvo La Biblia, haya circulado con mayor profusión en todo el mundo, o haya sido objeto de más ediciones y traducciones.” Heath añade que incluso en la antigüedad los matemáticos más destacados se ocuparon de él, que Herón, Papo (o Pappus), Porfirio, Proclo y Simplicio escribieron comentarios, que Theón de Alejandría lo reeditó alterando su lenguaje aquí y allá con la idea de alcanzar una mayor claridad y consistencia, y que Apolonio emprendió una discusión no muy exitosa de los primeros principios de la geometría, donde incluso intentó una deficiente prueba de los mismos. No sólo Heath se expresa elogiosamente de los Elementos al llamarlo “el más grande libro de texto de todos los tiempos”. Por ejemplo, Einstein recuerda una copia de los Elementos como un regalo que tuvo una gran influencia en él cuando era un niño, y se refiere a esta obra como el “pequeño libro sagrado de geometría.” 17 Lo dicho por Heath no contradice lo dicho por nosotros respecto a que los Elementos no son una mera ordenación de los conocimientos geométricos básicos. Por el contrario, una prueba de la grandeza de Euclides es que a la vez que organiza dicho conocimiento, nos muestra, en forma ordenada, la solución de diversos problemas que, como ya lo hemos dicho, la tradición debió considerar importantes. 18 Compárense estas palabras con lo dicho por Muller en el parágrafo anterior. Quizá Muller tenga razón en el análisis que realiza con todo el aparato conceptual del siglo veinte; no obstante, lo dicho por él sólo toca una de las aristas del problema, y omite un punto importante: los propósitos para los cuales fueron escritos los Elementos, entre los que Proclo y Heath incluyen el aprendizaje de la geometría. 20 1. E UCLIDES , K ANT, H ILBERT Y ... Por otra parte se sabe que Abraham Lincoln llevaba una copia de Euclides en su alforja y lo estudiaba hasta altas horas de la noche a la luz de una lámpara, pues, según decía, nunca podría llegar a ser un abogado si no sabía lo que era una demostración.19 Newton escribió los Principia inspirado en la obra de Euclides, y Baruch Spinoza publicó un libro denominado Ética demostrada según el orden geométrico en el que sigue, en el campo de la Ética, un orden axiomático similar al de Euclides. Esto nos muestra la alta estima en que desde siempre se tuvo a este libro, el cual se consideró un paradigma de la ciencia deductiva hasta el siglo XIX. 4. El quinto postulado En la Analítica Posterior Aristóteles comenta que hasta su tiempo nadie había podido fundar la teoría de las paralelas sobre una sólida base, pues en todos los intentos se hallaba oculta una petición de principios. Parece ser entonces que no fue sino con Euclides que esta situación se remedió mediante el establecimiento de un sólido postulado que era indispensable para la construcción de la geometría. No obstante, su aceptación se debió más que nada a su necesidad, no a su evidencia, convirtiéndose en el único escollo realmente importante en la obra de Euclides. Desde muy pronto la menor claridad de este principio, comparado con el resto de los postulados, dio lugar a una multitud de intentos por demostrarlo a partir de los demás, un esfuerzo que como sabemos culminó en el siglo diecinueve con el descubrimiento de las ahora llamadas geometrías no euclidianas. Tales intentos incluyen nombres como los de Claudio Ptolomeo (100-178), el mismo Proclo (412-485), Omar Khayyam (1048-1113), Nasîradîn at-Tusî (1201-1274), John Wallis (1616-1703), Girolamo Saccheri (1667-1733), Johann Heinrich Lambert (1728-1777) y Adrien-Marie Legendre (1752-1833).20 ¿En qué momento dieron inicio tales esfuerzos? A ciencia cierta no lo sabemos, e incluso se estima que fue Euclides el primero en intentarlo.21 Sabemos por Proclo que desde un principio 19 En una página web, Héctor Coronado cita las siguientes palabras de Lincoln, pronunciadas en un discurso en Ohio: “Hay dos maneras de establecer una proposición. Una es demostrándola mediante la razón, y la otra es exponiendo lo que grandes hombres de antaño pensaban al respecto, y así, pasarla por verdadera por el puro peso de la autoridad. Ahora bien, si el juez Douglas puede demostrar que esto es del dominio público -el derecho de un hombre a hacer a otro su esclavo- y demostrarlo como Euclides demostraba sus proposiciones, entonces no tengo objeción. Pero cuando viene, convocando un principio de autoridad de hombres que repudiaban ese principio, pido que no se le permita continuar.” http://librepensar.blogspot.mx/2010/12/geometria-leyes-y-pensamiento-critico.html 20 Cf. Heath, 1956, pp. 204-219. 21 No se sabe si Euclides fue el primer geómetra que trató de probar el quinto postulado. Lo que sí se le reconoce es haber sido el primero en advertir que se trataba de un principio indispensable para edificar la geometría. Al respecto, en su estudio sobre los Elementos, Thomas L. Heath se refiere a Euclides con las siguientes palabras: “Cuando consideramos los innumerables intentos que se hicieron durante más de dos mil años por demostrar el postulado, muchos de ellos realizados por hábiles geómetras, no podemos sino admirar el genio de un hombre que concluyó que tal hipótesis, que encontró necesaria para la validez de todo su sistema geométrico, era en verdad indemostrable.” (Euclides, 1956, p. 202). 1.2. L A GEOMETRÍA EN LOS Elementos DE E UCLIDES 21 el postulado fue cuestionado como tal y que se llevaron a cabo intentos por demostrarlo o deshacerse de él adoptando otras definiciones de paralelismo. Salvo por los intentos de Saccheri y Lambert, en todos los casos la “demostración” se apoya, implícita o explícitamente, en alguna suposición equivalente al quinto postulado. Ejemplos de ello son las siguientes proposiciones, que fueron utilizadas en su momento: a) Hay al menos un triángulo en el que los ángulos internos suman dos rectos. b) Existe un par de triángulos similares que no son congruentes. c) Existe un par de líneas rectas igualmente distantes entre sí en todos sus puntos. d) Dados tres puntos no colineales, hay una circunferencia que incide con ellos. e) Por cualquier punto dentro de un ángulo de 60o se puede trazar una línea recta que intercepta ambos lados del ángulo. f ) Dada un área arbitraria, hay un triángulo rectángulo con un área mayor. g) Si en un cuadrilátero tres ángulos son rectos, el cuarto ángulo también es recto. De las muchas equivalencias del quinto postulado, la más conocida en los tiempos modernos es la del matemático escocés John Playfair (1748-1819): h) Por un punto dado sólo se puede trazar una línea paralela a una línea dada.22 Esta forma del quinto postulado es muy útil para exponer lo que habría de ser uno de los más grandes descubrimientos matemáticos de todos los tiempos: la existencia de otras geometrías, en las que el postulado no se cumple, y sí alguna de sus negaciones.23 5. El concepto de teoría axiomática intuitiva o material. El modo en que Euclides organiza el conocimiento geométrico es lo que hoy llamamos axiomática intuitiva o material; lo podemos resumir así:24 a) Ciertos términos iniciales se definen a fin de establecer qué es lo que se pretende significar con ellos en el discurso. b) Cualquier otro término técnico del discurso se define a partir de los términos iniciales. Es condición que toda definición se exprese en términos de cosas anteriores y mejor conocidas que aquello que se define. 22 La existencia de al menos una paralela es consecuencia de la proposición I.27 si se asume que la línea recta tiene una extensión infinita. Esta suposición es falsa en el caso de la geometría de la esfera, donde “línea recta” significa “geodésica” o círculo máximo. 23 Hay dos formas de negar el postulado: rechazando la existencia de alguna paralela, o aceptando la existencia de más de una paralela. Al respecto, véase el apéndice B. 24 No queremos decir que Euclides fue el primero en proceder de esta manera, cosa que ignoramos; más bien, nos inclinamos a pensar que procedió con base en las ideas expuestas por Aristóteles en la Analítica posterior. 22 1. E UCLIDES , K ANT, H ILBERT Y ... c) Ciertas proposiciones tenidas por ciertas a partir del significado de los términos iniciales se enuncian sin demostración. A estas proposiciones se les llama axiomas o postulados.25 d) Cualquier otra proposición de la teoría se demuestra a partir de los axiomas. A tales proposiciones se les llama teoremas. Básicamente, el procedimiento consiste en aislar un grupo de conceptos y proposiciones que sirven como fundamento de todo lo demás. Vale considerar a los términos iniciales como datos intuitivos y a los axiomas como evidencias. Esta separación introduce un orden entre las proposiciones de la teoría conforme al cual se procede de los axiomas a los teoremas siguiendo, supuestamente, el camino de la lógica y de la argumentación ordinaria.26 6. A finales del siglo XIX el método axiomático que promoviera Euclides fue revalorado por parte de un amplio sector de matemáticos, y vuelto a utilizar en extenso dentro de esta disciplina, al grado que en la actualidad ha irrumpido en casi todos su dominios. Al respecto, llevó más de dos mil años redescubrir el potencial de este método, perfeccionarlo y reconocer sus limitaciones. A ello están ligados nombres como los de Moritz Pasch, Gino Fano, Giuseppe Peano, Ernst Zermelo, Alfred Tarski, Kurt Gödel y, por supuesto, el de David Hilbert, así como los de algunos notables opositores como Henri Poincaré y Hermann Weyl, quienes entre otras cosas critican su infertilidad y juzgan que la reducción axiomática representa una renuncia a la verdadera naturaleza de la matemática, que es creativa.27 Como veremos, en su desarrollo moderno, la lógica matemática hubo de crear las herramientas conceptuales necesarias para su perfeccionamiento y estudio. Valga esto como un apunte de una empresa que tuvo una enorme importancia en la matemática moderna, la cual, como veremos, supo extender, al igual que la teoría de conjuntos, su influencia en todas las direcciones, si bien bajo una nueva concepción más abstracta que la que impulsara Euclides en los Elementos. De esto nos habremos de ocupar en este libro. 25 En la concepción moderna no se establece ninguna distinción entre axiomas y postulados, por lo que estos términos son tratados como sinónimos. 26 Lo ideal sería que los axiomas fueran siempre mejor conocidos que lo que se demuestra a partir de ellos, mas esto no siempre es así. Por ejemplo, la proposición I.5 de los elementos, En todo triángulo isósceles los ángulos situados en la base son iguales entre sí, necesita para su demostración de algo que es menos evidente que ella, a saber, que dos rectas no circundan región alguna. 27 Si bien ninguno de estos autores niega la legitimidad del método axiomático como instrumento que da precisión a las herramientas matemáticas ya construidas, no le conceden ninguna importancia en la creación de nuevos conceptos o métodos, los cuales surgen del trabajo con algo más sustancial que habita en el dominio de la intuición. 1.3. L A DEMOSTRACIÓN EN LOS Elementos DE E UCLIDES 1.3. 23 La demostración en los Elementos de Euclides Con el paso del tiempo, el tipo de demostración que adopta Euclides en los Elementos se convirtió en una norma del rigor y un modelo a seguir que hubo de prevalecer hasta el siglo XIX, pudiéndose observar su efecto en numerosas obras tanto de la antigüedad como de la era moderna (v. gr., en trabajos como los de Diofanto, Apolonio, Pascal, Euler, Gauss, Steiner y Poncelet, por mencionar algunos casos relevantes). Como ya lo hemos señalado, el título “Elementos” comporta la idea de un sistema de proposiciones basado en principios, los cuales se dividen en dos clases, los axiomas (enunciados de carácter general aplicables en cualquier dominio) y postulados (enunciados específicamente geométricos). Los postulados son aquello cuya admisión se pide para hacer posibles las pruebas, y Euclides los elige tratando de reducir a un mínimo las dudas que pudieran surgir respecto a su verdad. En cuanto al resto de las proposiciones, aunque muchas de ellas parecen ser ciertas, Euclides evita recurrir como justificación a la experiencia o a la simple evidencia (aunque lo segundo no siempre lo logra). Más bien, en todo momento trata de proceder por la vía de la demostración, fundando las pruebas sobre lo que se ha establecido previamente y en conformidad con ciertos principios lógicos que asume sin mencionar. Así, en los Elementos cada teorema se expone como enlazado a los axiomas, los postulados y teoremas ya demostrados a través de una relación de aparente necesidad lógica, como una consecuencia de ellos. En lo que sigue centraremos nuestra atención en estas cuestiones, dejando de lado todo lo relativo a los problemas que Euclides intenta resolver. 1.3.1. La estructura de las proposiciones en los Elementos En los Elementos cada proposición se divide formalmente en seis partes que, grosso modo, son las siguientes: 1. Enunciado general de la proposición que se va a demostrar. Esto incluye la indicación de lo que se supone dado (hipótesis) y de lo que se pretende probar. 2. Disposición de lo dado en una figura. Por lo general se presentan en un diagrama distintos elementos (puntos, líneas, círculos, etc.) cuyo arreglo corresponde a lo enunciado en (1). Esto incluye la identificación de los datos mediante letras. 3. Declaración de lo que específicamente se quiere probar con relación a la figura o las cosas geométricas en cuestión, esta vez en términos de los datos específicos con que se cuenta. 4. Construcción de lo que resulte necesario para facilitar la demostración. Esto incluye el trazo de líneas y otros elementos adicionales. 5. La demostración propiamente dicha. Realización de las inferencias necesarias para alcanzar la conclusión buscada con base en los datos reconocidos o aceptados. 24 1. E UCLIDES , K ANT, H ILBERT Y ... 6. Conclusión: regreso al enunciado general confirmando lo que se ha demostrado. De estas partes, la 1, 5 y 6 son indispensables, mientras que algunas de las otras (o todas ellas) en ocasiones suelen omitirse por no servir a ningún propósito. El lector podrá constatar lo anterior a través de un examen de los ejemplos que hemos dado y de la proposición que a continuación veremos. Como pronto descubriremos, esta división guarda un estrecho vínculo con el uso de diagramas en las demostraciones. 1.3.2. La demostración euclidiana y el razonamiento geométrico según Kant En lo que sigue expondremos la manera en que Immanuel Kant (1724-1804) justifica y da cuenta de la demostración euclidiana, y el modo en que explica la naturaleza del conocimiento matemático. Esto será de gran importancia a lo largo de este texto. En la filosofía contemporánea se considera a Euclides como un paradigma de lo que se ha dado en llamar razonamiento diagramático. Y si bien muchos autores ven serios problemas en torno a este estilo de razonamiento (v. gr., Pasch, Muller), otros no lo hacen. Kant pertenece a esta última categoría. Euclides utiliza diagramas a lo largo de su obra, una práctica que Kant quiere explicar y justificar en su obra Crítica de la razón pura. Para ello recurre a una doctrina de su invención que podemos referir como teoría de la construcción esquemática en la intuición pura, algo a lo que volveremos en la sección 1.4. Por ahora será suficiente con analizar una de las muchas demostraciones que figuran en los Elementos. Nos referimos a la proposición 32 del libro I, a la que Kant hace abierta referencia (v. gr., en B743-45). Aquí el lector podrá advertir la manera en que Euclides divide la proposición conforme a lo dicho en la sección anterior. Proposición I.32 Si en un triángulo se prolonga uno de los lados, el ángulo externo es igual a los dos internos y opuestos, y los tres ángulos internos del triángulo son igual a dos ángulos rectos. Sea ABC el triángulo y prolónguese el lado BC hasta D. Digo que el ángulo externo ACD es igual a los dos internos y opuestos CAB y ABC y que los tres ángulos internos del triángulo ABC, BCA y CAB son igual a dos rectos. 1.3. L A DEMOSTRACIÓN EN LOS Elementos DE E UCLIDES 25 Por el punto C trácese la recta CE paralela a la AB. (I.31) Puesto que AB es paralela a CE, y AC es incidente con las dos, los ángulos alternos internos BAC y ACE son iguales entre sí. (I.29) Por otra parte, puesto que AB es paralela a CE, y BC es incidente con las dos, el ángulo externo ECD es igual al interno y opuesto ABC. (I.29) Pero se demostró que el ángulo ACE es igual al BAC. Luego el ángulo entero ACD es igual a los internos y opuestos BAC y ABC. Añádase el ángulo común ACB. Según esto serán los ángulos ABC, BCA y CAB igual a los ángulos ACD y ACB. Mas los ángulos ACD y ACB son igual a dos rectos. (I.13) Luego los ángulos ABC, BCA y CAB son igual a dos rectos. Por tanto, en todo triángulo, si se prolonga uno de los lados, el ángulo externo es igual a los dos internos y opuestos, y los tres ángulos internos del triángulo son igual a dos rectos, que es lo que se quería demostrar. Como de costumbre, Euclides utiliza un diagrama en torno al cual organiza el argumento. Esto no es algo circunstancial, sino una práctica usual entre los geómetras que habría de extenderse hasta el siglo XIX. La figura o diagrama en el ejemplo anterior corresponde a lo que Kant denomina “construcción de conceptos”, un rasgo distintivo de las ciencias matemáticas.28 Dice Kant: “El conocimiento filosófico es un conocimiento racional derivado de conceptos; el conocimiento matemático es un conocimiento obtenido por la construcción de los conceptos."(B741) y añade: “[...] el conocimiento filosófico sólo considera lo particular en lo universal; las matemáticas, lo universal en lo particular, e incluso en lo singular, pero sólo a priori y por medio de la razón."(B742). Aquí, “a priori” significa “con independencia de la experiencia”. El diagrama de la proposición I.32 es, en el sentido recién indicado, una construcción de los conceptos de triángulo, línea recta, etc. conforme a un cierto diseño que Euclides adopta por conveniencia. Es sobre la figura así obtenida que desarrolla el ulterior razonamiento, el cual ya no es general: nos habla del ángulo ABC, de la recta CD, etc. en vez de “cualquier ángulo interior de cualquier triángulo” o de “cualquier extensión de cualquiera de los lados de ese triángulo cualquiera”. Considera, pues, lo universal en lo singular (el triángulo ABC representa a todos los triángulos). La importancia del diagrama se manifiesta desde la formulación de la proposición, donde Euclides habla de ángulos internos y ángulos externos sin que haya en los Elementos una definición de estas nociones. De hecho, el significado de tales términos sólo se entiende con la figura (digamos que “interior” y “exterior” son nociones definidas implícitamente a través de ella). Así, el diagrama expone ciertos objetos en 28 En palabras de Kant, “construir un concepto” consiste en “presentar la intuición a priori que le corresponde [al concepto]”. En A713 y B741 da claras indicaciones de cómo se debe entender esta caracterización. En el contexto que nos ocupa, se trata de presentar, mediante una construcción con regla y compás, una figura cuyas partes corresponden a los conceptos y las ideas implicadas. 26 1. E UCLIDES , K ANT, H ILBERT Y ... consonancia con los conceptos aludidos en la proposición, un triángulo ABC y una extensión CD de uno de sus lados, pero en él se muestran muchas cosas más como, por ejemplo, la interioridad o exterioridad de los ángulos. Todavía más, en el texto Euclides nos pide trazar una recta CE paralela a AB sin indicar el sentido en que se debe dibujar. Esto sólo se aclara recurriendo al diagrama, donde dicha línea aparece hacia arriba, dividiendo el ángulo ACD en dos ángulos ACE y ECD, un hecho esencial para el posterior argumento.29 Esta propiedad de la línea CE sólo se puede reconocer en el diagrama, el cual se convierte de esta manera en una parte esencial de la demostración.30 Podemos decir, siguiendo a Liza Shabel, que en los Elementos muchos pasos cruciales en la demostración se dan en virtud de observaciones hechas en el diagrama. Es por esto que a este tipo de razonamientos se les suele llamar diagramáticos: “[Euclides] ofrece una lista de definiciones y nociones comunes que, propiamente entendidas, nos ayudan a leer la información contenida en diagramas construidos en conformidad con los postulados [. . . ] los diagramas permiten el razonamiento en la demostración al garantizar la inferencia deductiva.” (Shabel, 2003, p. 38). Lejos de ver un defecto en lo anterior, Kant lo considera un rasgo esencial de la demostración matemática, un recurso sin el cual no sería posible el conocimiento matemático en general. Para destacar su papel e importancia nos pide imaginar qué pasaría si, por ejemplo, preguntáramos a un filósofo la misma cuestión (¿a qué son igual los ángulos internos de un triángulo?) y lo dejáramos hallar la respuesta a su manera. El punto es que nunca daría con algo parecido a la proposición I.32: sólo contaría con los conceptos de recta, ángulo, etc., y por mucho que reflexionara sobre éstos no alcanzaría ninguna conclusión nueva. El filósofo no podría seguir el camino de Euclides, pues sólo conoce por conceptos, no por construcción de conceptos. Trazar un triángulo sería considerar lo universal en lo particular, pero él “sólo considera lo particular en lo universal”. Él podría analizar y clarificar tales conceptos, pero nunca llegaría a propiedades no contenidas en ellos. En el otro extremo tenemos al geómetra, quien lo primero que hace es representar los conceptos mediante una o más construcciones, para después razonar sobre los diagramas resultantes; al hacerlo, descubre propiedades de los objetos que no están contenidas en los conceptos mismos (es decir, que no se pueden extraer de los conceptos considerados éstos de manera 29 En efecto, un paso crucial en la demostración es el hecho de que ACE + ECD = ACD. No obstante, esta propiedad no se sigue de los postulados y las nociones comunes, sino que es tomada directamente del diagrama. 30 En la proposición I.32, cuando Euclides habla de trazar por el punto C la recta CE paralela a la AB, se refiere al trazo de lo que hoy denominamos el segmento CE. Es por esto que Euclides debería indicar en qué sentido se ha de realizar la construcción, pues hay dos sentidos posibles y sólo uno de ellos conduce al fin propuesto. Obviamente, si la recta utilizada fuera de suyo ilimitada en ambas direcciones, nuestra crítica se vendría abajo; no obstante, lo hecho por Euclides no corresponde a lo anterior, pues lo que él hace es trazar una línea de un punto C a otro punto E (los extremos de la línea, según reza la definición DI.3). Aquí, Euclides se conduce con estricto apego al espíritu griego, según el cual lo positivo es el estado de finitud; así, considerar una línea recta infinita y sin extremos sería tanto como considerar un objeto en estado de imperfección. 1.3. L A DEMOSTRACIÓN EN LOS Elementos DE E UCLIDES 27 aislada y al margen de toda intuición).31 Podemos decir entonces que el diagrama no es una mera ilustración de la proposición I.32, sino un elemento central de la prueba que orienta nuestros razonamientos. En palabras de Kant: “A través de una cadena de inferencias y guiado siempre por la intuición, el geómetra consigue así una solución evidente y, a la vez, universal del problema” (B745) (subrayado nuestro).32 Tal uso de los conceptos in concreto es para Kant un rasgo distintivo del método matemático y en él apoya la idea de que los juicios de la matemática son sintéticos a priori. Este es el argumento de Kant: la geometría es sintética porque sus resultados se obtienen realizando construcciones.33 La geometría es a priori porque de los objetos construidos sólo considera aquello que se sigue de las condiciones universales de la construcción y nunca de las condiciones específicas de la construcción (i. e., de nada empírico); es por ello que el geómetra puede afirmar la validez del resultado para todas las intuiciones correspondientes al concepto (al respecto, véase B44). Como veremos, estas afirmaciones tienen hoy en día un valor limitado. En lo dicho por Kant podemos hallar una justificación de porqué Euclides divide las proposiciones en la forma ya señalada: se trata de preparar el terreno para la demostración construyendo un diagrama pertinente. Este modo de proceder se explica advirtiendo que, en su momento, Euclides no contaba con un aparato lógico que permitiera el manejo abstracto de proposiciones de carácter general, lo cual no se pudo lograr plenamente sino hasta el siglo XIX con la aparición de la teoría de la cuantificación.34 31 Esta observación de Kant alude a la actividad de un geómetra anterior al siglo XIX, y sólo es aplicable en forma limitada a la matemática contemporánea. Recordemos que la presentación axiomática de Euclides expresa las propiedades y relaciones de un sistema de objetos bien definido, al que suele referirse en las demostraciones a través de los diagramas. Véase al respecto la nota al pie número 2 de la sección 1.1. 32 Por intuición Kant entiende el modo por el cual el conocimiento se refiere de manera directa e inmediata a su objeto, y que sólo tiene lugar en la medida en que dicho objeto afecte de alguna manera a nuestro psiquismo (comúnmente a través de nuestros sentidos). La intuición se califica como empírica cuando el objeto nos es dado a través de los sentidos, y pura cuando no pertenece a ninguna sensación externa o cuando es a priori, es decir, independiente de la experiencia. Tal sería el caso de la intuición geométrica, pues en ella los objetos no son entidades previamente dadas en la naturaleza, sino construcciones nuestras (esto, a pesar de que el objeto resultante, digamos un diagrama, aparezca como algo empírico, visual). Pronto volveremos a este punto. 33 Es más, la sinteticidad también se debe a que muchas propiedades de los objetos geométricos resultan de su construcción, donde se tornan evidentes, sin que las mismas resulten de las definiciones, axiomas y postulados. La construcción es, en este sentido, indispensable. 34 En el apéndice A mostramos cómo en el siglo XVII se seguían utilizando los diagramas a la manera de Euclides. Esto lo hacemos a través de un ejemplo: el modo en que Pascal prueba un resultado que equivale a la integración de la función seno. Asimismo, al final del apéndice analizamos una demostración tomada de los Elementos de Euclides desde la perspectiva de los recursos lógicos que utiliza. 28 1.4. 1. E UCLIDES , K ANT, H ILBERT Y ... La teoría kantiana de esquemas Una prueba como la de la proposición I.32 de los Elementos sólo es posible cuando se tienen los medios para producir objetos de la intuición que sean imagen de los conceptos implicados. Conforme a Kant, esto se logra mediante la aplicación de esquemas, es decir, por razón de ciertos procedimientos o reglas que indican en general cómo construir tales objetos.35 Refiramos esto al ejemplo anterior. Veamos, por ejemplo, la definición de triángulo que se halla en los Elementos: Triángulo es cualquier figura rectilínea comprendida por tres rectas. El cometido de esta definición, como el de tantas otras, es delimitar el concepto correspondiente, es decir, señalar las condiciones que ha de cumplir una figura para ser un triángulo. Para poderla aplicar (i. e., para poder decir “¡esto es un triángulo!”) debemos tener un objeto, cuya producción no resulta de la definición misma. Al respecto la definición es inerte, pues nada dice acerca de la producción o el manejo de los triángulos. Lo mismo puede decirse de otras definiciones como, por ejemplo, la de círculo. Dado que los objetos con que trata la geometría clásica no son empíricos, sin la posibilidad de su construcción en la intuición pura los correspondientes conceptos serían inoperantes. Según Kant, dicha posibilidad es justo lo que separa al geómetra del filósofo: el primero cuenta con esquemas que le permiten producir tales representaciones, mientras que el segundo no. Actúa, por decirlo de alguna manera, sirviéndose de procedimientos que los traen a la representación, ya sea mediante imágenes mentales, ya sea mediante construcciones sensibles.36 35 Conforme a Kant, entre un concepto y las cosas particulares que se subsumen bajo él se halla una instancia mediadora, un término que hace posible la aplicación del primero a las segundas. Esta instancia tiene un pie de cada lado; por una parte, es una representación pura (libre de todo elemento empírico); por la otra, es intelectual y sensible a la vez (Véase, CRP, A138/B177). Kant denomina esquemas trascendentales a tales representaciones. 36 Cuando decimos “esta figura es un triángulo” estamos aplicando un concepto a un objeto sensible, es decir, vemos en el objeto algo que incluye lo representado en el concepto (v. gr., tres líneas rectas, tres vértices, etc.). Como sabemos, en el caso de la geometría clásica tales objetos (las figuras) no se toman de la experiencia. Lo que Kant afirma es que dichos objetos se construyen justo mediante la aplicación de esquemas, los cuales nos permiten conectar los conceptos puros (en este caso el de “triángulo”) con 1.4. L A TEORÍA KANTIANA DE ESQUEMAS 29 La prueba de la proposición I.32 se apoya decididamente en la posibilidad anterior. En ella Euclides traza un triángulo ABC, prolonga el lado BC hasta D, etc. preparando de este modo el escenario para la demostración. En este caso las construcciones realizadas tienen como base el uso, real o imaginario, de la regla y el compás. V. gr., la figura ABC es un “triángulo” porque su elaboración se lleva (o se puede llevar) a cabo con tales instrumentos. El uso de la regla y el compás está sugerido esquemáticamente en los tres primeros postulados, a los que da vida. Enunciemos de nuevo dichos postulados de manera simple: Postulado I. Trazar una línea desde un punto cualquiera a otro punto cualquiera; Postulado II. Prolongar por continuidad en línea recta una recta delimitada; Postulado III. Para cada centro y radio describir su círculo. El uso de la regla y el compás está claramente presupuesto en lo anterior. De hecho, estos instrumentos han sido parte del bagaje de todo geómetra desde la antigüedad hasta nuestros días, al punto de colmar la geometría elemental con tales figuras. Esto es particularmente cierto con relación a los Elementos, donde todos los diagramas se construyen con base en ellos. Dice Kant: [. . . ] lo que en matemáticas se llama postulado es una proposición práctica que no contiene más que la síntesis a través de la cual nos damos un objeto y producimos su concepto. Por ejemplo, describir un círculo con una línea dada, partiendo de un punto dado, en un plano. Semejante proposición no puede demostrarse, ya que el procedimiento que exige es precisamente el procedimiento a través del cual producimos el concepto de esa figura. (B287). Veamos la pertinencia de lo anterior con relación al tercer postulado de Euclides; éste: (i) sintetiza los conceptos de punto y línea (i. e., los reúne en un todo); (ii) para cada punto y línea dados, determina un objeto: el círculo con centro en el punto dado y radio la línea dada; y (iii) alude a un procedimiento (a un esquema) que se halla en la base del concepto de círculo (en este caso el uso de un compás). En resumen: conforme a Kant, es con base en ciertos esquemas que el geómetra realiza la construcción de conceptos; y es examinando los objetos construidos que descubre sus propiedades. Los esquemas conectan de manera confiable los conceptos con sus representaciones. Y como en la indagación el geómetra no se sirve de nada empírico, sino sólo de lo que es común a todas las figuras del género propuesto, la conclusión los objetos sensibles. Se trata de operaciones sometidas a reglas que permiten componer objetos que se subsumen bajo los conceptos (i. e., construir objetos que forman parte de la extensión del concepto). En cada caso, el esquema consiste en la representación de un procedimiento general por el cual la imaginación ofrece su imagen al concepto. Kant diría al respecto que sin esquemas los conceptos son vacíos, pues no les podemos dar ningún objeto. 30 1. E UCLIDES , K ANT, H ILBERT Y ... alcanzada la puede afirmar para todas ellas.37 De ahí el salto de lo singular a lo general. Por ello la última línea de la proposición I.32: “Por tanto: En todo triángulo, si se prolonga uno de los lados, el ángulo externo es igual a los dos internos y opuestos, y los tres ángulos internos del triángulo son igual a dos rectos”. Finalizamos esta sección con un breve comentario acerca del problema que significó el uso de diagramas en el siglo XIX. Esto tenderá un puente hacia las discusiones venideras. Al tratar de probar el teorema de que toda magnitud que crece continuamente, pero no más allá de toda medida, se aproxima a un valor límite, Dedekind se vio obligado a recurrir a evidencias geométricas. Su reacción fue buscar un riguroso fundamento, puramente aritmético, para los principios del análisis matemático.38 El resultado al que llegó (1872) es bien conocido: se trata del concepto de número real definido a través de las llamadas cortaduras, las cuales son centrales en la construcción genética de los números reales. Un problema con las cortaduras es que no son esquematizables.39 Tiempo atrás Weierstrass había presentado en 1861 un ejemplo de función continua que no es diferenciable en ningún punto, es decir, una “curva” que, siendo continua, no tiene tangente en ninguna parte. Esto contradijo la idea intuitiva de que toda función continua es diferenciable excepto en puntos especiales, algo claramente sugerido por los diagramas.40 Surgieron muchas preguntas: ¿Cómo tratar con esta clase de “curvas” para las que no se tienen esquemas de producción?, ¿en qué sentido se puede decir que 37 Kant podría presentar el siguiente argumento como justificación de la validez de las proposiciones geométricas: “Si bien la construcción se realiza en la intuición sensible, en la investigación no se toma en cuenta ningún rasgo empírico del objeto así construido (como, por ejemplo, la longitud de sus lados o la medida de sus ángulos); y si bien el diagrama es empírico (un objeto sensible), en la demostración sólo se considera la acción de construir sus elementos (un triángulo, una recta, etc.) sin hacer uso de ninguna particularidad propia de los objetos específicos que resultan de la construcción. Por tanto, las propiedades establecidas son válidas para todas las figuras que se pueden obtener de esa manera.” Como se puede constatar, Euclides suele contravenir sutilmente esta exigencia en muchas demostraciones. Por ejemplo, la prueba de la proposición I.32 que ya hemos analizado, se basa en la peculiaridad de que el ángulo ACD aparece como la suma de ACE y ECD en el diagrama, un hecho que podemos ver pero no probar. Se trata, simplemente, de algo que así aparecen en la construcción. Por otra parte, es muy difícil imaginar que el resultado de la construcción pudiera ser de otra manera, lo cual facilita la aceptación de tal hecho (“así son los triángulos”). En ello descansa, al menos parcialmente, el carácter sintético de esta proposición (la I.32) según Kant. 38 Al referirse a los fundamentos del análisis, Dedekind no aclara el sentido en que lo hace, pues el término tiene diversos significados con relación a las teorías matemáticas. Al respecto, en la sección 1.5.1 incluimos una nota acerca de algunos de los sentidos en que se le utiliza. Asimismo, en la sección 2.5 incluimos un comentario más amplio acerca de las inquietudes de Dedekind cuando decidió fundamentar la aritmética de los números reales. 39 A este punto (al de la imposibilidad de esquematizar las cortaduras de Dedekind) habremos de volver en la sección 1.7. 40 Históricamente, la curva de Weierstrass es el primer fractal conocido. Lo notable en este caso es que disponemos de una fórmula para ella: W (x) = ∞ ∑ an cos(bn πx), donde 0 < a < 1, b es un entero impar y n=0 ab > 1 + 3π . 2 1.5. L A CRÍTICA MODERNA Y LA LÓGICA 31 estas entidades son objetos matemáticos?41 Los anteriores no fueron casos aislados, sino parte del acontecer matemático durante la segunda mitad del siglo XIX, donde hubo una fuerte oposición al uso de diagramas en las pruebas matemáticas. Por ejemplo, en 1882 Pasch estableció como norma apoyar los argumentos matemáticos exclusivamente en los axiomas y en la lógica. Dice al respecto: “Si la geometría ha de ser realmente deductiva, entonces la deducción ha de liberarse por completo de cualquier referencia al significado de los conceptos geométricos, al igual que de las figuras. Así, sólo reconocemos aquellas pruebas en las que cada paso se apoya en las proposiciones precedentes y las definiciones”.42 Al examinar con espíritu rigorista los argumentos de Euclides, el mismo Pasch descubrió algunas suposiciones que nadie había notado con anterioridad. Por ejemplo, las relacionadas con el orden de los puntos en una línea. Todos pueden trazar un diagrama y notar que si en una línea recta un punto B está entre un punto A y un punto C, entonces ni C está entre A y B, ni A está entre B y C. No obstante, nadie antes que Pasch había sentado las bases para tratar lógicamente con esta clase de observaciones, quizá porque se les consideraba demasiado obvias. La consecuencia de tal desatención fue precisamente la necesidad de recurrir a la intuición, de manera que la forma lógica de lo que se hacía seguía siendo poco clara. A diferencia de Kant, Pasch vio en el método deductivo el método de las matemáticas y no sólo una parte de él, lo cual exigió acentuar el rigor y renunciar al uso de diagramas en las demostraciones. 1.5. La crítica moderna y la lógica Lejos de una explicación plausible de la demostración matemática, la lógica moderna ve en el constructivismo de Kant algo inconciliable con la pureza del método. Las objeciones son numerosas: ¿Es acaso inevitable el recurso a la intuición o a la evidencia sensible en las pruebas? Si los teoremas de, digamos, los Elementos, se siguen necesariamente de los axiomas, ¿no deberían bastar para su demostración ciertos argumentos lógicos? Así, la encomiada explicación ofrecida por Kant en el siglo XVIII se convirtió en el blanco de múltiples ataques: ¿Cómo es que las proposiciones de la geometría, que supuestamente se infieren de los axiomas y postulados, requieren para su demostración de objetos construidos en la intuición? Ciertamente, la eficacia del método utilizado por Euclides en los Elementos justificaba su persistencia; no obstante, éste no era el tema del debate. 41 Aquí podemos anticipar la respuesta de Hilbert, quien en un cuaderno escribiera la siguiente nota: “Cualquier cosa que sea objeto del pensamiento es por lo mismo objeto de las matemáticas. La matemática no es el arte de la computación, sino el arte de la no computación”. [Alles was Gegenstand des Denkens ist, ist daher Gegenstand der Mathematik. Die Mathematik ist nicht die Kunst des Rechnens, sondern die Kunst des Nichtrechnens.] Al respecto, véase (Hayashi, 2007). En cuanto a Kant, lo único que podemos decir por el momento es que Hilbert, antes que negar su epistemología, lo que busca es generalizarla en adecuación a la matemática moderna. Esto lo veremos más adelante. 42 Pasch, 1882. Citado en “Nineteenth Century Geometry”, Stanford Encyclopedia of Philosophy, http://plato.stanford.edu. 32 1. E UCLIDES , K ANT, H ILBERT Y ... Las críticas cobraron mayor fuerza cuando algunos matemáticos pusieron un mayor énfasis en la pureza de los métodos deductivos y se negaron a seguir apoyando las pruebas en la intuición, en la que vieron tan sólo un recurso heurístico. Estas críticas se agudizaron tras la aparición de la lógica simbólica y el cálculo de predicados, en los que el manejo abstracto de los argumentos es una posibilidad real. Esto contrasta con lo sucedido en las épocas de Euclides y de Kant, en las que no había una sólida base formal (lógica) capaz de sustentar con pruebas rigurosas la mayoría de las proposiciones de los Elementos y otras teorías matemáticas. Para aclarar esta cuestión examinemos, a manera de ejemplo, la prueba que ofrece Euclides de la proposición I.1: Dada una recta delimitada construir sobre ella un triángulo equilátero (véase la sección I.2). Desde el punto de vista de la lógica, Euclides apoya el argumento en la siguiente proposición, la cual resulta evidente a partir de la figura: “Dos círculos cuyos centros son los extremos de un segmento y cuyos radios son iguales a dicho segmento, tienen al menos un punto en común.” En la proposición I.1 los extremos del segmento y el punto en cuestión se denotan con las letras A, B y G, respectivamente. Es obvio que G depende de A y B. En la prueba dicho punto aparece como resultado de una construcción, sin que haya un argumento formal que pruebe su existencia. Al respecto, un geómetra de la antigüedad (o de la época de Kant) juzgaría ridícula esta exigencia, cual diciendo: “¿pues qué otra cosa podría haber ahí donde se cruzan los círculos?”, o bien “no veo cómo se podría evitar en dicha construcción que los círculos se intersecasen.” Vista desde la lógica moderna, dicha dependencia existencial no se puede expresar ni en la lógica monádica (marco en el que podemos ubicar la teoría aristotélica del silogismo), ni en la lógica de los estoicos, ambas subyacentes a los Elementos.43 Esto nos da una idea de la importancia y necesidad de recurrir a los diagramas en las demostraciones. Volvemos a lo mismo: de la misma manera en que la construcción euclidiana pone al descubierto ciertas relaciones entre los objetos geométricos, también pone a la vista ciertos objetos, lo cual dispensa la necesidad de probar su existencia.44 Por otra parte, los axiomas y postulados que figuran en los Elementos no son suficientes para demostrar tales cosas. Desde la perspectiva actual podemos decir que el uso de figuras en la geometría clásica compensa la falta de una teoría general de relaciones y de la cuantificación.45 Dicho 43 La lógica de los estoicos se puede pensar como una parte de la lógica proposicional. En cuanto a la lógica monádica el lector hallará una breve explicación en la ficha “Monadic predicate calculus” de Wikipedia. Al respecto, Leopold Löwenheim probó en 1915 que este fragmento del cálculo de predicados es decidible, una propiedad que se rompe con la simple adición de un símbolo de relación binaria arbitrario. El trabajo de Löwenheim está publicado en (Heijenoort, 1967, pp. 228-251). 44 Queremos insistir en lo dicho en la sección 1.2: Los postulados de Euclides no están ahí para establecer la existencia de los objetos, sino la posibilidad de su construcción. V. gr., el postulado I, “Trazar una línea recta desde un punto cualquiera a otro punto cualquiera” tiene como finalidad permitir la construcción de una línea recta (hacerla visible), no “traerla a la existencia”. 45 Quizá un breve comentario nos ayude a aclarar lo anterior. Desde la perspectiva actual, la lógica se puede entender como una teoría general de relaciones; general, porque no trata con ningún orden de objetos en particular; “de relaciones” porque al no ocuparse de la naturaleza o esencia de las cosas, lo único que “le queda” es ocuparse de la forma en que los individuos se vinculan entre sí, es decir, de sus mutuas relaciones. El instrumento ideal para llevar a cabo esta tarea es la teoría de la cuantificación, la cual permite expresar cómo se dan las relaciones sin hacer referencia a nada en particular, a ningún orden 1.5. L A CRÍTICA MODERNA Y LA LÓGICA 33 con respecto a los Elementos: el uso de figuras suple las limitaciones del aparato lógico disponible. Es mucho lo que se ha dicho acerca de estas lagunas en el sistema euclidiano, el cual carece, por ejemplo, de axiomas para la continuidad sobre cuya base se podría probar la existencia del punto G en el ejemplo anterior. V. gr., ¿acaso no cabe la posibilidad de que los círculos fueran discontinuos? Obviamente, esta cuestión se mira como una insensatez desde la “geometría del papel”, pues es evidente que tales círculos se cortan en un punto. No obstante, este innegable hecho visual no se puede ni deducir ni refutar con base en los postulados de Euclides. Así, en la matemática moderna se han podido definir sistemas de puntos, líneas y círculos que “satisfacen” los postulados de Euclides sin cumplir con la propiedad de que dos círculos como los de la proposición I.1 tengan algún punto en común.46 Lo anterior nos lleva a contrastar lo que hoy se entiende por “lógica” con lo que se entendió hasta principios del siglo XIX. Hasta entonces la lógica se había entendido como un canon, es decir, como un sistema de reglas para la correcta conducción del entendimiento y la razón, no como una teoría general de relaciones. Su objeto eran las reglas formales de todo pensar. Examinemos con cierto detalle este punto. Cuando Euclides escribió los Elementos, una de las finalidades de la lógica era formular los principios que rigen el recto uso de la razón en general. El modus ponens es uno de tales principios: “Si la implicación A → B es verdadera, y se sabe, por hipótesis o por demostración, que A es verdadera, habrá que afirmar que B también es verdadera”. Fue con base en este principio, por ejemplo, que pudimos concluir en la prueba de la proposición I.1 que las tres rectas GA, GB y AB son iguales entre sí, pues teníamos “Si GA = AB y GB = AB, entonces GA = GB” (NC1) y “GA = AB y GB = AB”. Por ello podemos calificar como correcta la inferencia realizada. A esto es a lo que nos referimos cuando hablamos del canon de la razón pura: un sistema de reglas y principios a priori (es decir, independientes de la experiencia) para pensar hilada o lógicamente, es decir, para manipular en el pensamiento premisas y creencias y alcanzar conclusiones. Esto concuerda con el modo en que Euclides organiza las proposiciones: primero, de objetos. Esto de algún modo anticipa la explicación que daremos en la sección 1.6 sobre lo que hace Hilbert con relación a la geometría pura. 46 Por ejemplo, en el plano racional Q × Q, los círculos C((−1, 0), 2) y C((1, 0), 2) no se intersecan, √ pues la solución algebraica del sistema de ecuaciones correspondiente es x = 0, y = ± 3. Obviamente, para poder decir que los objetos de este sistema “satisfacen” los postulados de Euclides debemos cambiar el sentido de los postulados, dejar de pensar en ellos como proposiciones acerca de construcciones geométricas, y verlos como proposiciones acerca del modo en que ciertas entidades, llamadas “puntos”, “líneas”, “círculos”, etc., se relacionan entre sí (es decir, verlos como descriptivos de cierto tipo de relaciones, tal como lo acabamos de indicar en la nota anterior). Ahora bien, en caso de que queramos seguir entendiendo los postulados en términos de construcciones, y en aparente contradicción con lo que acabamos de decir, podemos pensar en ellos como proposiciones relativas a la construcción de ciertas figuras discontinuas. Podemos imaginar, por ejemplo, una regla y un compás “discontinuos”, que sólo pueden dibujar puntos con coordenadas racionales, es decir, que trazan las figuras de manera “intermitente”, produciendo dibujos semejantes a los que obtenemos en un monitor a través de la computadora. Hay incluso un término asociado a ello: pixel (aunque el ojo vea otra cosa.) 34 1. E UCLIDES , K ANT, H ILBERT Y ... establece los datos que servirán como punto de partida del argumento; después, conduce el argumento conforme a principios deductivos lógicamente aceptables. Este “uso” de la razón se da con relación a un contenido sobre el que versan las demostraciones. Un mérito de la construcción es que ésta nos permite hablar de objetos particulares (el segmento AB, el segmento AG, el punto G, etc.) en vez de “cualquier segmento y cualquier punto correspondiente a la intersección de dos círculos que tienen por radio a dicho segmento”, cuya expresión lógica requiere de diversos cuantificadores ligados entre sí. Es por ello que la lógica de proposiciones basta casi por sí sola para justificar las deducciones que Euclides ofrece en los Elementos (véase el apéndice A). Este modo de entender la demostración y la geometría misma eclipsa la posibilidad de considerar sistemas relacionales puros, en los que el razonamiento se conduce bajo la mera asunción de premisas puestas arbitrariamente, sin tomar en cuenta si éstas corresponden o no a un orden particular de objetos (uso especulativo de la razón). Como veremos, Hilbert se inclina abiertamente por esta segunda posibilidad al momento de fundamentar la geometría. En una teoría de esta naturaleza las relaciones de dependencia existencial (como las que podemos observar en la matemática moderna) se tienen que manejar a través de hipótesis relativas al sistema de objetos en que tales relaciones se podrían dar. Tales hipótesis se hallan ausentes en la geometría tradicional. En parte esto es así porque, como ya lo hemos dicho, la teoría se ocupa de un orden particular de objetos para los que no es necesario postular su existencia. Por otra parte, tal como lo acabamos de señalar, la lógica clásica no tenía los medios para manejar sistemas de relaciones abstractas, ni contaba con los recursos expresivos necesarios para formular proposiciones de uso común en la matemática moderna como, por ejemplo, el axioma del supremo o la densidad de los números racionales. Tales relaciones se expresan mediante fórmulas en las que los cuantificadores se agrupan en bloques de indisoluble dependencia. Veamos algunas de ellas: 1. Densidad de los números racionales: ∀x∀y(x < y → ∃z(x < z ∧ z < y)) 2. Axioma de incidencia entre puntos y líneas: ∀A∀B(p(A) ∧ p(B) ∧ A = B → ∃z(l(z) ∧ I(z, A) ∧ (I(z, B)))) 3. Existencia de raíces: ∀x1 ∀x2 . . . ∀xn ∃z( f (x1 , x2 , . . . , xn , z) = 0) 4. Definición de continuidad en un punto: Cont( f , a) ≡de f a ∈ D f ∧ ∀ε(ε > 0 → ∃δ (δ > 0 ∧ ∀x(x ∈ D f ∧ |x − a| < δ → | f (x) − f (a)| < ε)) 5. Axioma del supremo: ∀X[(X ⊆ R ∧ X = 0/ ∧ ∃y(y ∈ R ∧ ∀x(x ∈ X → x ≤ y)] → ∃z[z ∈ R ∧ ∀x(x ∈ X → x ≤ z) ∧ ∀y((x ∈ X → x ≤ y) → z ≤ y)] En todos estos casos la forma lógica “∀x∃z” (donde la “z” cuya existencia se afirma depende de la “x”) se halla presente. La imposibilidad de expresar esta dependencia en la lógica antigua se debe al hecho de que en ella la cuantificación sólo se aplica 1.5. L A CRÍTICA MODERNA Y LA LÓGICA 35 a lo que hoy denominamos predicados monádicos (funciones proposicionales de un solo argumento), de modo que los cuantificadores siempre se pueden separar.47 Esto se debe a que cada predicado monádico sólo puede estar regido por un cuantificador, por lo que en esta lógica es imposible expresar relaciones de dependencia como, por ejemplo, “cada número real tiene un inverso aditivo” cuya estructura cuantificacional es la ya referida. En la geometría tradicional este problema pasa inadvertido, pues tales cuestiones se resuelven en la práctica recurriendo, por decirlo en la jerga actual, a los contenidos semánticos de la teoría (v. gr., escudriñando figuras o reconociendo intuitivamente las propiedades de los números). Insistimos: las construcciones “sacan a la luz” los objetos y sus relaciones, compensando de esta manera los recursos lógicos faltantes. Podemos decir entonces que en la geometría tradicional el razonamiento no podía limitarse al manejo formal de los conceptos. Requería, como lo señala Kant, de esa actividad adicional que él denomina construcción de conceptos en la intuición pura. Es por ello que las figuras constituyen una parte vital de la demostración geométrica clásica, la cual comprende objetos espacio-temporales. Todo esto lo consigna Kant en su teoría acerca de la demostración geométrica. La lógica no basta, “el conocimiento matemático es un conocimiento obtenido por la construcción de los conceptos”.48 Hoy en día, como ya lo hemos dicho, en amplios sectores de las matemáticas se ha excluido el uso de figuras en las demostraciones, o se le ha “reglamentado” implícitamente, reduciendo su papel en la mayoría de los casos al de elementos auxiliares para la comprensión intuitiva. A su vez, las pruebas se consideran, en el límite, como algo estrictamente formal e independiente de la interpretación que pudieran tener los axiomas. Esta idea de la demostración como objeto formal se aparta de la idea tradicional según la cual la demostración geométrica trata con un contenido sobre el que el geómetra forma juicios. El punto de vista prevaleciente en la actualidad es que la lógica es un instrumento formal mediante el cual desplegamos sistemas de relaciones consideradas en sí mismas, muy lejos ya de la teoría aristotélica. Podemos decir entonces que: I) II ) la concepción clásica de la lógica no es la concepción moderna, y que la concepción clásica de la lógica no permite diferenciar entre la interpretación de una teoría y su forma pura, como sucedió en el caso de la geometría. ejemplo, la fórmula ∀x∃y(Fx → Gy) es equivalente a ∃xFx → ∃yGy. líneas, con lo que venimos tratando es con la incompletud semántica de los axiomas, la cual está relacionada con la dificultad de “captar en conceptos” todas las propiedades de los objetos nombrados en ellos. Este tipo de consideraciones llevarían más tarde a Gödel a considerar la incompletud de la aritmética formal. En el caso de la geometría euclidiana el uso de construcciones (el recurso a la intuición) es una manera de suplir los recursos faltantes, pues en el empalme de construcciones se tornan evidentes muchas propiedades de los objetos considerados. Kant parece reconocer que los postulados de Euclides constituyen un sistema incompleto, que de ellos no se siguen por lógica los teoremas de los Elementos. No obstante, lo que para otros es un estigma no lo es para él. 47 Por 48 Entre 36 1. E UCLIDES , K ANT, H ILBERT Y ... Este último es un punto en el que se concentró una parte de la crítica moderna. Como veremos con cierto detalle más adelante, el desarrollo de la matemática en el siglo XIX ofreció los elementos necesarios para diferenciar la teoría geométrica de sus interpretaciones, una diferencia similar a la que podemos hallar entre la sintaxis y la semántica de una teoría formal. Esto sucederá al narrar algunos pasajes por los que Hilbert transitó en su camino hacia su primer formalismo. 1.5.1. Tres sentidos distintos de la palabra “fundamentos” Como su nombre lo indica, el libro Grundlagen der Geometrie de Hilbert es un tratado sobre los fundamentos de la geometría. Al respecto, antes de pasar al análisis de dicha obra debemos considerar tres diferentes sentidos (no todos) en que el término “fundamentos” se suele utilizar con relación a la matemática, y ver de cuáles de ellos se sirve Hilbert. Al referirnos a los fundamentos de una teoría podemos distinguir, grosso modo, al menos tres acepciones distintas del término: el fundamento como principios, como condición de posibilidad y como origen.49 En una primera instancia tenemos el problema de los fundamentos de las distintas teorías matemáticas en el sentido de los conceptos y principios en los que cada una de ellas se apoya. En segundo lugar tenemos el problema de los fundamentos de la ciencia matemática como tal, es decir, de las condiciones que la hacen posible. Por último, tenemos un significado muy general del término, según el cual el fundamento sería la explicación del conocimiento matemático, de sus raíces y orígenes (una cuestión más bien epistémica). Teniendo en mente estos tres sentidos del término, podemos decir que la cuestión de los fundamentos es al mismo tiempo una tarea lógica, matemática y filosófica que debemos diferenciar de la simple reflexión en torno a la naturaleza de la matemática. 1. Sin lugar a dudas, el primero de estos sentidos es el más utilizado en la matemática. Se trata de los conceptos y principios básicos sobre los que se erige o se quiere erigir una teoría. En ocasiones, esta tarea de fundamentación incluye el establecimiento de los tipos de razonamiento que se aceptan en la construcción de la teoría. De esto último veremos algunos ejemplos más adelante, cuando nos refiramos a Russell, Poincaré, Brouwer, Weyl y el mismo Hilbert. 49 Estos tres sentidos los podemos hallar fuera de las matemáticas. Cuando un juez pregunta a un abogado que intenta levantar una demanda “¿en qué fundamenta usted la acusación?” (i. e., “¿en qué preceptos legales apoya usted sus argumentos?”), el término “fundamento” se está usando en el primer sentido del término. Cuando se dice que “el respeto a los derechos civiles consignados en la ley es el fundamento de la democracia”, el término se está utilizando en el segundo sentido. Finalmente, cuando se afirma que “la revolución mexicana fue el fundamento del modernismo es este país” (i. e., el origen del modernismo en México se halla en la revolución mexicana), el término se está utilizando en el tercer sentido. 1.5. L A CRÍTICA MODERNA Y LA LÓGICA 37 En particular, este es el sentido que se le dio al término con relación al análisis matemático durante la segunda mitad del siglo XIX (Cauchy, Weierstrass et al).50 Se trataba de clarificar sus conceptos, determinar sus principios e introducir el rigor en las demostraciones, una tarea de la que nos ocuparemos con cierto detalle en la sección 2.5. Esta labor se vio continuada con la introducción del concepto de número real (Dedekind y Cantor), la introducción de métodos de demostración no constructivos en el análisis (Hilbert y Zermelo) y la aparición de la teoría de conjuntos (Dedekind y Cantor). Y si bien estos últimos hechos produjeron algunas reacciones, podemos decir que lo logrado constituyó un fundamento para la matemática clásica en el primer sentido del término. 2. Como pronto veremos, en los Grundlagen Hilbert no sólo establece los fundamentos de la geometría en el sentido recién señalado, sino que además pone en juego un segundo sentido: en términos generales, lo que fundamenta a cualquier teoría matemática es el hecho de que no podamos inferir contradicciones a partir de sus axiomas. Tener esta propiedad, la de ser no contradictoria, es lo que la posibilita como teoría matemática, i. e., es su condición de posibilidad. En el caso específico de la geometría, esto significa que la teoría ya no tendría como fundamento el hecho de ser descriptiva de las propiedades del espacio, tal como se le consideró hasta bien entrado el siglo XIX (al respecto, véase la nota al pie número 3 del prefacio). En otras palabras, para Hilbert, la consistencia es el fundamento de las teorías matemáticas en el segundo sentido del término, es decir, lo que las hace posibles. A esto habremos de volver a lo largo del texto, pues se trata de una cuestión que tuvo una enorme importancia para él. 3. Finalmente tenemos la idea de fundamento en tanto que explicación del conocimiento matemático, de sus raíces y orígenes. Una de las mejores exposiciones de este punto de vista lo tenemos en Bertrand Russell, quien en 1901 escribió lo siguiente: La matemática pura consiste enteramente de aseveraciones como que si tal y tal proposición es verdadera de cualquier cosa, entonces tal otra proposición es verdadera de esa cosa. Es esencial no deliberar si la primera proposición es en realidad verdadera, ni mencionar qué es eso acerca de lo cual es verdadera. [...] Si nuestra hipótesis es acerca de nada y no acerca de uno o más objetos particulares, entonces nuestra deducción constituye matemáticas. Así, la matemática se puede definir como la materia en la que nunca sabemos de qué estamos hablando, ni si lo que decimos es verdad. (Russell, 1901, p. 84). Esta caracterización que intenta Russell de la matemática encierra una “lectura” modal: los enunciados matemáticos no son acerca de nada en particular; sus 50 Obviamente, cuestiones. los personajes aquí nombrados son sólo algunos entre quienes trabajaron en estas 38 1. E UCLIDES , K ANT, H ILBERT Y ... teorías son simples despliegues lógicos donde lo único que se puede afirmar es la verdad condicional de sus teoremas (sus proposiciones son necesariamente verdaderas). Al respecto, las palabras de Russell encierran algo más: la idea de que la matemática es parte de la lógica, es decir, que está radicada en ella. Este sería su fundamento en el tercer sentido del término: ser parte de la lógica es lo que explica al conocimiento matemático; en ella se encuentran sus raíces, su origen. De esto último nos ocuparemos en extenso en las secciones 3.2 y 3.7. 1.6. La geometría en los Grundlagen der Geometrie de Hilbert En 1899, justo antes del cambio de siglo, Hilbert publicó su afamado libro Grundlagen der Geometrie como distintivo de un nuevo modo de entender las teorías matemáticas. Se trata de un texto que, al igual que los Elementos de Euclides, estaba destinado a ser un punto de referencia de la matemática de su tiempo. En esta ocasión se trataba de la matemática moderna, cuya expansión inició poco más o menos en la primera mitad del siglo diecinueve con el renacido interés por la geometría proyectiva, el descubrimiento de las geometrías no euclidianas y el surgimiento del álgebra abstracta (v. gr., la teoría de grupos y el álgebra de Boole). Dicha expansión continuó con la clarificación de los conceptos básicos del análisis matemático (v. gr., el de número real el de función), la aparición de la teoría de conjuntos de Cantor y la renovación de la lógica en la segunda mitad del siglo.51 Estos avances dieron lugar a la formación de un nuevo punto de vista en torno a la naturaleza de la matemática, un punto de vista que Hilbert habría de afinar en los Grundlagen. Al respecto, la literatura relativa a estas cuestiones es sumamente extensa, requiriendo el estudio de cada una de ellas de muchas horas de estudio.52 Y si bien la obra de Hilbert no se puede entender plenamente sin tomar en cuenta todo lo sucedido en ese periodo, aquí no habremos de examinar en detalle tales cuestiones.53 51 Varios de estos temas son tratados en el siguiente capítulo y en los apéndices. el prefacio a su libro Worlds Out of Nothing, A Course in the History of Gemetry in the 19th Century, un texto de 376 páginas, Jeremy Gray dice que “[el libro] no es un intento de escribir una historia completa de la geometría en el siglo diecinueve, por la sencilla razón de que faltan muchas cosas. Simplemente, un curso manejable que refleje la coherencia de los desarrollos y capture suficientemente su importancia debe dejar muchas cosas fuera para valer la pena.” A continuación Gray enumera algunas cuestiones que deja sin tocar o que aborda de manera incompleta: la presentación de Chasles de la geometría proyectiva, el trabajo matemático de Monge, la relación entre el trabajo de Chasles y el de Poncelet, las contribuciones de Steiner a la geometría proyectiva, toda la obra de Grassmann y Von Staudt. Esto, sólo con relación a la geometría en el siglo diecinueve. 53 En su obra escrita durante el periodo 1891-1899, y sólo con relación a los fundamentos de la geometría, Hilbert cita, entre otros, a Beltrami, Cremona, Fano, Helmholtz, Hertz, Klein, Lie, Lobachevsky, Möbius, Pasch, Peano, Riemann, von Staudt y Wiener. Cubrir los trabajos de estos autores, los cuales tocaron aspectos de la geometría que Hilbert habría de abordar, requeriría de mucho tiempo. Los aspectos referidos tienen que ver, implícita o explícitamente, con el carácter de los objetos matemáticos, la naturaleza de la geometría y la pretensión de dar un tratamiento enteramente formal a las pruebas. Al respecto, en los Grundlagen Hilbert sintetiza muchos de los puntos de vista perfilados en tales 52 En 1.6. L A GEOMETRÍA EN LOS Grundlagen der Geometrie DE H ILBERT 39 Como alternativa, optamos por ir directamente a nuestro punto de interés a través de dos momentos en la vida intelectual de Hilbert que ponen de manifiesto el punto de vista que adopta al escribir los Grundlagen.54 1.6.1. Dos ideas subyacentes a los Grundlagen Comencemos con un pasaje que, nos parece, señala el inicio del primer formalismo de Hilbert. Nos referimos a su asistencia a la Reunión Anual de Matemáticos Alemanes en la Universidad de Hale en 1891, donde acudió a una conferencia dictada por Hermann Wiener en la que este último abordó diversas cuestiones relativas a las bases de la geometría que llamaron poderosamente la atención de Hilbert. 1.6.1.1. La conferencia de Wiener Wiener dirigió su plática hacia la construcción de la geometría y sus fundamentos. Lo ahí expuesto y lo sucedido posteriormente nos pueden dar una idea de la manera en que Hilbert arribó a su creación de 1899. Comencemos con Wiener. Entre otras cosas, su conferencia trató de la validez general del método axiomático y de la posibilidad de desarrollar la geometría proyectiva con base en los teoremas de Desargues y Pascal, los cuales presentaban algunos problemas en cuanto a su demostración. Lo siguiente resume algunas de las cuestiones planteadas por él: Una condición exigible a toda teoría matemática es que la prueba de sus proposiciones sólo se sirva de aquellas hipótesis de las que realmente depende (una cuestión que ya había sido planteada por Pasch). Tales suposiciones son las relativas a la existencia de ciertos objetos y la posibilidad de ciertas operaciones [relaciones] mediante las cuales dichos objetos se pueden vincular entre sí. En caso de lograrse lo anterior, se tendrá un dominio autosustentable de la ciencia.55 investigaciones, y niega o pasa por alto muchos otros. 54 Nuestro plan es ir directamente a algunas ideas centrales del pensamiento de Hilbert relatando dos importantes momentos en su desarrollo intelectual. En ello concordamos con Paco Ignacio Taibo II, quien en una entrevista televisada sostuviera que muchas veces la clave para comprender a un personaje está en las anécdotas, y que esto constituye una legítima técnica de investigación y exposición cuando se le maneja correctamente. De hecho, Taibo II se ciñe a este esquema de organización en su libro Pancho Villa, una biografía narrativa sin renunciar por ello al rigor o a la profundidad en la investigación. La única diferencia es que aquí no se trata de comprender a Hilbert, sino de entender su obra. 55 Aquí por autosustentable debemos entender que no depende de otras suposiciones (v. gr., de nociones ajenas al tema como, por ejemplo, la noción de congruencia en el caso de la geometría proyectiva) ni de lo que sucede en otros dominios (v. gr., de lo que sucede en un espacio con un número mayor de dimensiones o en el álgebra). 40 1. E UCLIDES , K ANT, H ILBERT Y ... La geometría proyectiva plana podría ofrecer un ejemplo de dominio autosustentable. Los objetos básicos son los puntos y las líneas, y las operaciones básicas las de unir [con una línea] y cortar [intersecar dos líneas]. Si se quita el ropaje geométrico, lo que resulta son dos clases de elementos y dos tipos de operaciones. Estas operaciones son de tal naturaleza que al efectuarlas con objetos de una misma clase se produce un elemento de la otra [(punto-punto) → (línea por ellos), (línea-línea) → (punto de intersección)]. Las proposiciones geométricas obtenidas bajo tales suposiciones (además de las proposiciones combinatorias relativas al número de elementos) forman un sistema cerrado de enunciados. En la actualidad [1891] hay casos de proposiciones geométricas que no se pueden obtener de esa manera, es decir, el dominio de la geometría no es, en su totalidad, autosustentable. Tal es el caso, por ejemplo, del teorema de Desargues, cuya validez se infiere por proyección del espacio tridimensional o mediante nociones métricas. La importancia de este teorema radica en que permite demostrar el teorema fundamental de la geometría proyectiva plana y todas las proposiciones derivadas usualmente mediante la adición geométrica de vectores y puntos.56 Muchos de estos problemas, los cuales atañen más que nada a la lógica, a la pureza del método y a la posibilidad de edificar la geometría como una ciencia autónoma y abstracta, fueron acometidos por Hilbert en los siguientes años, sobre todo en los Grundlagen.57 Por ejemplo, en sus Lecciones sobre geometría euclidiana (1898-1899) 56 La importancia del teorema de Desargues también se manifiesta en el hecho de que con base en él es posible derivar la geometría proyectiva pura en el sentido de von Staudt, i. e., como una geometría que no utiliza la métrica en el sentido ordinario (Toepell, 1986). 57 Muchos de los problemas mencionados por Wiener son de interés para Hilbert en virtud del nuevo significado que le quiere dar a la expresión “fundamentar una teoría matemática”, el cual se aleja de otras ideas precedentes. Al respecto, como ya lo hemos dicho en la sección 1.5.1, hay al menos tres significados claramente diferentes para esta expresión: 1. Por una parte tenemos la cuestión de los fundamentos de las distintas teorías matemáticas, es decir, de los conceptos y principios en los que cada una de ellas se apoya. Esta idea la podemos hallar, por ejemplo, en la labor de Weierstrass en torno a las bases del análisis matemático y, modernamente, en muchos lugares como, por ejemplo, en la presentación axiomática de la teoría de anillos, campos, etc. o de la geometría proyectiva. 2. Tenemos también el problema de los fundamentos de la ciencia matemática como tal, es decir, de las condiciones que la hacen posible. En gran medida este es el sentido fuerte que le imprime Hilbert en los Grundlagen, sobre todo cuando aborda la cuestión de la consistencia de los axiomas. Aquí, lo que sirve como fundamento es el hecho de formar un todo coherente, siendo esta condición lo que da sustento a la teoría, no el hecho de que sea o pueda ser descriptiva de algún tipo de realidad o de un sistema de objetos determinado. 3. Por último tenemos un significado muy general del término, según el cual el fundamento de la matemática sería la explicación del conocimiento matemático, es decir, de sus raíces y orígenes. Con relación a este último punto, Hilbert soslaya esta cuestión en los Grundlagen, si bien más tarde la abordará con relación a la aritmética, tal como lo veremos en el capítulo 4, sobre todo en las 1.6. L A GEOMETRÍA EN LOS Grundlagen der Geometrie DE H ILBERT 41 Hilbert se ocupa de cuestiones tales como la imposibilidad de demostrar bajo ciertas condiciones el teorema de Desargues en el plano, el significado lógico de los axiomas, la construcción de modelos aritméticos, pruebas de independencia para los axiomas de incidencia y orden y la elaboración de una aritmética de segmentos con base en el teorema de Desargues. Volviendo a la disertación de Wiener, sabemos, por un comentario de Otto Blumenthal, del impacto que ésta tuvo en Hilbert.58 Según esto, al comentar la plática con otros matemáticos en la estación de Berlín, Hilbert habría dicho: “Uno siempre debe poder decir mesa, silla y tarro de cerveza en vez de punto, línea y plano”.59 Esta frase se considera como distintiva del punto de vista sobre el que se sustenta el libro de los Grundlagen: la parte intuitiva de los conceptos geométricos es irrelevante en la reconstrucción axiomática de la teoría. En apoyo a lo dicho por Blumenthal tenemos una nota escrita por Hilbert alrededor de 1893 en la que habla de “las matemáticas sobre sistemas de mesas, pizarrones, etc. (Tisch, Tafel, etc.)”.60 Asimismo, en una carta dirigida a Frege en 1899 (que este último resumiera en un cuaderno de notas), Hilbert se expresa con términos muy parecidos al señalar que la naturaleza íntima de los elementos básicos es irrelevante, pues la teoría no es otra cosa que un armazón de conceptos: [. . . ] es obvio que toda teoría es tan sólo un andamiaje o esquema de conceptos junto con las relaciones necesarias entre ellos, y que los elementos básicos se pueden pensar como uno quiera. Si al hablar de mis puntos pienso en algún sistema de objetos, v. gr., el sistema: amor, ley, deshollinador, [...] y tomo mis axiomas como relaciones entre estas cosas, entonces mis proposiciones, v. gr., el teorema de Pitágoras, son válidas también para estas cosas. En otras palabras: cualquier teoría se puede aplicar a una infinidad de sistemas básicos de elementos. Lo único necesario es aplicar una transformación reversible [. . . ] y establecer que los axiomas serán correspondientemente los mismos para las cosas transformadas. Esta circunstancia se utiliza, por ejemplo, en el principio de dualidad, etc. y yo me he servido de ella en mis pruebas de independencia. [. . . ] Pero la circunstancia que he mencionado no puede ser un defecto de las teorías (representa más bien una enorme ventaja), y es en todo caso inevitable. (Tomado de Frege, 1980, pp. 40-41. El subrayado es nuestro). Podemos decir entonces que el año de 1891 señala el momento en que Hilbert emprende secciones 4.2 y 4.3. Obviamente, estas cuestiones pueden presentarse entremezcladas, tal como lo hacen las dos primeras en los Grundlagen. Para mayor información véase (Torres, 2003). 58 Otto Blumenthal fue el primer estudiante de doctorado de Hilbert. muß jederzeit an Stelle von ’Punkte, Geraden, Ebenen’ ’Tische, Stühle, Bierseidel’ sagen können”. El lugar donde Blumenthal narra lo anterior es en su “Lebensgeschichte” [Historia de la vida (de Hilbert)] reproducido en (Hilbert, 1935, pp. 388-429). 60 Hayashi, 2007, sección 2.1.7. 59 “Man 42 1. E UCLIDES , K ANT, H ILBERT Y ... la defensa de una nueva visión de las teorías matemáticas, la cual yace como sustrato del texto de 1899: la de que toda teoría matemática es, en su forma pura (axiomática), un mero “andamiaje de conceptos”, el cual se sustenta (fundamenta) en su coherencia interna. Sin lugar a dudas, un factor que reforzó las ideas de Hilbert en esta dirección fue la consideración del principio de dualidad de la geometría proyectiva, cuya mención hemos subrayado en la cita anterior. 1.6.1.2. El principio de dualidad en la geometría proyectiva En la matemática actual el término “dualidad” tiene varios significados, los cuales se relacionan entre sí por una sola idea: la de una conversión de conceptos, teoremas y estructuras matemáticas en otros conceptos, teoremas o estructuras mediante una transformación específica. El caso más conocido (y el primero en la historia) es el llamado Principio de dualidad de la geometría proyectiva: Dado cualquier teorema de la geometría proyectiva plana, al intercambiar en él los términos “punto” y “línea” (intercambiando, de ser necesario, las frases “estar en” y “pasar por”), lo que resulta es otro teorema igualmente válido. Veamos a través de un ejemplo cómo trabaja la dualidad, para después ver de qué manera su surgimiento afectó la visión clásica de las teorías geométricas. Consideremos el teorema de Pappus, un importante resultado de la geometría proyectiva. Teorema del hexágono de Pappus Si los puntos A, B y C están en una recta, y los puntos A’, B’ y C’ están en otra recta, entonces los puntos de intersección P = AB ∩ A B, Q = BC ∩ B C y R = CA ∩ C A están alineados. (En otras palabras: Si los vértices de un hexágono se hallan alternados en dos rectas, entonces los puntos de intersección de los lados opuestos están alineados). Figura 1.1. Ilustración del teorema de Pappus en el plano euclidiano El dual del teorema de Pappus es el siguiente: 1.6. L A GEOMETRÍA EN LOS Grundlagen der Geometrie DE H ILBERT 43 Si las rectas a, b y c concurren en un punto, y las rectas a , b y c concurren en otro punto, entonces las líneas p, q y r definidas por las parejas de intersecciones (a ∩ b , a ∩ b), (b ∩ c , b ∩ c) y (c ∩ a , c ∩ a) son concurrentes.61 Figura 1.2. Ilustración del teorema dual de Pappus Aquí la dualidad se presenta con un par de teoremas, cada uno de los cuales se puede obtener del otro mediante un esquema simple y uniforme de substitución de términos: Punto ↔ Línea, Puntos alineados ↔ Líneas concurrentes, Punto de intersección de líneas ↔ Línea por los puntos. El valor de la dualidad es que con ella disponemos de un procedimiento que duplica nuestra capacidad para demostrar teoremas, pues nos ofrece dos resultados por el costo de uno, una ganancia del cien por ciento.62 Esta cuestión, sumamente valorada por Hilbert, sería motivo de un amplio comentario a no ser porque nuestro interés es otro por el momento: dilucidar la lectura que hiciera Hilbert del principio de dualidad. Para ello, conviene contrastar su punto de vista con el de Pasch. 61 Obviamente, la noción dual de “puntos en una recta” es la noción de “líneas concurrentes”. Es importante notar que cada enunciado geométrico tiene la misma forma lógica que su dual. Cabe señalar que la utilización de algunas nociones tomadas de la teoría de conjuntos es prescindible, debiéndose su presencia a la simple idea de facilitar la exposición. 62 Otra famosa pareja de teoremas duales es la formada por el teorema del hexágono de Pascal y el teorema de Brianchón: Teorema del hexágono de Pascal (1640).- Si los vértices de un hexágono se hallan sobre una cónica, entonces los puntos de intersección de los lados opuestos están alineados. Teorema de Brianchón (1806).- Si los vértices de un hexágono se hallan sobre una cónica, entonces las líneas que pasan por los vértices opuestos son concurrentes. Un caso de teorema auto dual es el de Desargues (1636): Dos triángulos están en perspectiva desde un punto, si y sólo si están en perspectiva desde una línea. 44 1. E UCLIDES , K ANT, H ILBERT Y ... Moritz Pasch fue un matemático que trabajó laboriosamente en los fundamentos de la geometría proyectiva durante el siglo XIX; en particular, fue uno de los primeros en ofrecer una presentación axiomática de esta teoría en la que el principio de dualidad se halla presente. Al respecto, Pasch no sólo vio en este principio una herramienta de gran utilidad, sino algo contrario a nuestra comprensión intuitiva de las nociones de punto y línea, pues no consideraba creíble que estos términos se pudieran intercambiar.63 Esta simple observación muestra que para él, como para otros geómetras del siglo XIX, los términos geométricos aún conservaban cierto lastre ontológico. Por contraste, hay una segunda lectura del principio de dualidad que toca la esencia del primer formalismo de Hilbert: no sólo se trata de algo contrapuesto a nuestras ideas acerca de lo que son los puntos y las líneas, sino de una señal. En efecto, la posibilidad de intercambiar los términos “punto” y “línea” se debe a que para efectos de la teoría estas nociones son simétricas. Por tanto, podemos permutar su interpretación sin caer en incorrecciones, es decir, sin que los enunciados de la teoría dejen de ser una descripción objetiva de ciertos hechos geométricos. Aclaremos lo anterior. Si proporcionáramos los axiomas de la geometría proyectiva a dos individuos que ignoraran el significado intuitivo que les damos a las palabras “punto” y “línea”, y les pidiéramos que ilustraran el teorema de Pappus con un diagrama, bien podría suceder que el primero de ellos diera como respuesta la Figura 1.1 y el segundo la Figura 1.2 anteriores: uno llamaría punto a lo que el otro denomina recta, y viceversa. Simplemente, cada uno de ellos habría escogido una interpretación diferente para estos términos, ambas aceptables.64 Esta posibilidad amplió considerablemente el horizonte: los teoremas geométricos se podían interpretar de manera distinta a como en un principio se tenía en mente. Por tanto, no encajaba concebir la teoría como representación unívoca de un sistema de objetos; más bien, ésta asomaba como una red de relaciones entre términos cuyo significado podía variar.65 En otras palabras (y dicho en tiempo presente): la teoría lo único que logra es delimitar a los objetos que le dan origen en tanto que partes de un sistema (o estructura), reflejando sus propiedades y mutuas relaciones, pero nada relativo a su “naturaleza íntima” (como, por ejemplo, el “ya no tener partes” de los puntos). Hilbert tenía en claro todo lo anterior al momento de escribir los Grundlagen. Como testimonio tenemos el fragmento que hemos subrayado en la sección anterior de la 63 Véase al respecto la nota biográfica sobre Moritz Pasch de J. J. O’Connor y E. F. Robertson que aparece en http://www-history.mcs.st-andrews.ac.uk/Biographies/Pasch.html 64 Esto no fue lo que hicimos al trazar las Figuras 1.1 y 1.2. En ambos casos las palabras “punto” y “línea” las utilizamos de la misma manera. Lo diferente eran las proposiciones ilustradas (la primera era el teorema de Pappus, la segunda el teorema dual de Pappus). No obstante, la dualidad se puede entender también como la posibilidad de intercambiar directamente la interpretación de esto términos sin desvirtuar con ello la validez de los teoremas. Por tanto, la Figura 1.2 es también una ilustración del teorema de Pappus si aceptamos llamar “línea” a lo que antes llamábamos “punto”, y viceversa. 65 Esta manera de entender los enunciados teóricos es el sostén de la teoría de modelos. 1.6. L A GEOMETRÍA EN LOS Grundlagen der Geometrie DE H ILBERT 45 carta que dirigiera a Frege en 1899. La mención que hace ahí de la dualidad muestra que al escribir el libro ya tenía en mente la lectura recién expuesta de dicho principio. Podemos decir entonces que la geometría proyectiva jugó un doble papel en la génesis del formalismo de Hilbert. Primero, le sugirió que en un sistema axiomático los términos matemáticos no actúan semánticamente como constantes, sino como variables, es decir, como expresiones cuyo significado puede cambiar. Segundo, le sugirió que ninguna teoría matemática tiene una única lectura como referida a un dominio particular de objetos; más bien, las teorías son sólo formas o moldes diseñados para alojar una gran variedad de materias a tratar. Las siguientes son algunas expresiones que se han utilizado para referirse a esta situación: “recipientes vacíos” (Pasch) “teorías hipotéticodeductivas desligadas de toda interpretación concreta posible” (Weyl), “sistemas de objetos no interpretados” (Curry). 1.6.2. La geometría en los Grundlagen Podemos decir que en los Grundlagen, el método axiomático encuentra su expresión moderna y toma la forma con que se le conoce hoy en día. Se trata, quizá, de la mejor presentación del nuevo enfoque axiomático y una destacada exposición de las bases de la geometría en general y de la geometría euclidiana en particular. En su momento dicho método sirvió como ninguna otra cosa para promover este nuevo punto de vista y establecer un modo distinto de presentar las teorías matemáticas. El impulso que dio a las investigaciones en torno a los fundamentos de las matemáticas no se puede subestimar, pudiéndose considerar que el programa de Hilbert, que más adelante veremos, fue una secuela del mismo. El texto fue el resultado de un curso consagrado al análisis axiomático de la geometría que Hilbert impartió en la Universidad de Göttingen en 1898-1899. Hermann Weyl se refiere a esta obra con las siguientes palabras: La tierra estaba preparada, principalmente por la escuela italiana de geómetras. Aun así, pareció como si en el horizonte, donde un puñado de hombres con un fino sentido de la orientación se había abierto camino en el crepúsculo, hubiese aparecido de súbito el Sol. Con toda claridad y firmeza vemos establecerse el concepto axiomático, según el cual toda la geometría es un sistema hipotético-deductivo: depende de las definiciones implícitas de los conceptos de los objetos espaciales y de relaciones que contienen los axiomas, no de la descripción de su contenido intuitivo. En él se levanta un sistema de axiomas geométricos completo y natural. Se les exige que satisfagan los requisitos lógicos de consistencia, independencia y completud, y por medio de unas cuantas geometrías muy peculiares, construidas ad hoc, la prueba de independencia se logra en detalle.66 66 Weyl, 1944, p. 500 46 1. E UCLIDES , K ANT, H ILBERT Y ... Hilbert fija las bases de la teoría axiomática sin la ayuda de ningún simbolismo especial y en un lenguaje no más técnico que el de Euclides. Algo novedoso en el tratamiento de la geometría es que parte de la obra está dedicada a investigar cuestiones que hoy en día se denominan metamatemáticas, en las que el objeto de estudio es la teoría geométrica, es decir, sus teoremas y axiomas. De estas investigaciones la primordial es la destinada a establecer la consistencia de los axiomas, en tanto que las otras se centran en la dependencia e independencia lógica entre proposiciones –por ejemplo, qué teoremas se deducen de qué axiomas.67 Figura 1.3. Esquema de la actividad metamatemática En cuanto al lenguaje, Hilbert podría haber escrito las proposiciones geométricas en la notación simbólica desarrollada por Peano y su escuela, pero no lo quiso hacer. Por ejemplo, en vez del enunciado “los puntos A y B están en la recta a” pudo escribir simplemente φ (A, B, a), de modo que la expresión misma no evocara ningún tipo de relación predeterminada. Una fórmula como φ (A, B, a) representaría una relación cualquiera entre objetos indeterminados de los que nada sabríamos más allá de lo dicho en los axiomas. No obstante, Hilbert prefirió no recurrir a un simbolismo de esta naturaleza por razones de conveniencia que más adelante veremos. 1.6.3. Los axiomas Hilbert inicia la exposición axiomática de la geometría con las siguientes palabras: Aclaración. Pensemos en tres clases diferentes de objetos. Llamemos a los objetos del primer sistema puntos y designémoslos con A, B,C, . . .; llamemos a los objetos del segundo sistema rectas y designémoslas con a, b, c, . . .; a 67 La metamatemática estudia las propiedades de los sistemas deductivos (v. gr., su consistencia). Como tal, se trata de una investigación que se desarrolla en un segundo nivel, donde el énfasis se pone en la manera en que los axiomas se relacionan entre sí. Esto se aclara señalando que en el caso de la geometría, el interés ya no se centra en los puntos, las líneas, los triángulos, etc., sino en los enunciados con los que nos referimos a ellos (un segundo nivel de abstracción). 1.6. L A GEOMETRÍA EN LOS Grundlagen der Geometrie DE H ILBERT 47 los del tercer sistema llamémoslos planos y designémoslos con α, β , γ, . . .. Los puntos se llaman también elementos de la geometría lineal, puntos y rectas se llaman elementos de la geometría plana; y puntos, rectas y planos se llaman elementos de la geometría espacial o del espacio. Supongamos que puntos, rectas y planos están en ciertas relaciones mutuas que designaremos con las palabras “estar en”, “entre”, “paralelo”, “congruente” y “continuo”, cuya exacta y completa descripción se logrará por medio de los axiomas de la geometría.68 Nótese que aquí Hilbert no intenta, a diferencia de Euclides, clarificar las nociones de “punto”, “línea” y “plano” mediante definiciones explícitas. En cuanto a los axiomas éstos se distribuyen en cinco grupos, cada uno de los cuales expresa, en palabras de Hilbert, “ciertos hechos, conexos entre sí y fundamentales, de nuestra intuición.”69 Los grupos son: Grupo I, axiomas de incidencia; grupo II, axiomas de orden; grupo III, axioma de paralelismo, (axioma de Euclides), grupo IV, axiomas de congruencia, y grupo V, axiomas de continuidad. Dada la extensión del conjunto de axiomas, la lista completa se presenta (con ligeras modificaciones respecto de la edición de 1899) en el apéndice C. La indefinición de los términos primitivos tiene como propósito, entre otras cosas, evitar recurrir a cualquier significado que éstos pudieran tener durante el desarrollo interno de la teoría (a diferencia de lo que hace Euclides en los Elementos). Esta postura concuerda con la observación hecha por Pasch en su libro Vorlesungen über neuere Geometrie (Lecciones sobre la nueva geometría) de 1882, donde afirma que los axiomas, bajo la nueva perspectiva, no son “verdades auto evidentes”, sino aseveraciones acerca de términos indefinidos y que tales aseveraciones son las únicas que se pueden utilizar en el desarrollo de la geometría. Esta novedosa actitud frente a los axiomas la expresa Hilbert en una carta dirigida a Frege en 1899 con las siguientes palabras: Yo no quiero asumir nada como conocido por anticipado; considero mi explicación de la sección 1 [de los Fundamentos] como una definición de los conceptos punto, línea, plano —si uno añade nuevamente todos los axiomas de los grupos I al V como marcas características. Si se buscan otras definiciones de ‘punto’, v. gr., mediante paráfrasis en términos de inextensión, etc., entonces me debo oponer a tales intentos en forma decisiva; uno busca algo que nunca encontrará porque no hay nada allí. (Tomado de Frege 1980, p. 39). La idea subyacente es que los axiomas definen implícitamente a los términos primitivos y sus relaciones. Si alguien preguntara ¿qué son los puntos, las líneas y los planos? 68 Hilbert 69 Hilbert 1902, p. 1. 1902, p. 1. 48 1. E UCLIDES , K ANT, H ILBERT Y ... La respuesta de Hilbert sería “cualesquiera objetos que, como parte de un sistema de relaciones, satisfagan estos axiomas”, a la vez que señalaría hacia la lista de los mismos.70 Esta idea de no atribuir internamente ningún significado a los términos primitivos no fue del agrado de todos. Por ejemplo, Frege le reprocha a Hilbert que con base en los postulados que encabezan los Grundlagen no puede saber si su reloj de bolsillo es un punto, pues en ningún sitio se da una definición explícita de este concepto.71 Hilbert no responde directamente a esta cuestión, aunque la respuesta es la ya indicada: el reloj de bolsillo del señor Frege será un punto en caso de que forme parte de un sistema de objetos que satisfaga lo dicho en los axiomas. Históricamente, este nuevo modo de entender las teorías axiomáticas sentó las bases para el desarrollo de la teoría de modelos e impulsó una nueva manera de pensar las teorías matemáticas. Conforme a este punto de vista, antes que del estudio de un orden particular de objetos, las teorías matemáticas se ocupan de estructuras generales. Esta nueva tendencia derivaría posteriormente en lo que hoy se conoce como estructuralismo matemático.72 En cuanto al alcance de los axiomas, estos suministran una base para toda la geometría elemental del plano y del espacio. Con base en ellos es posible demostrar todos los teoremas de los Elementos sin necesidad de realizar construcciones o introducir diagramas, los cuales si acaso actúan como simples recursos auxiliares en el razonamiento. Dicho lo anterior debemos insistir en que el propósito de Hilbert no se limitó a ofrecer un cuadro axiomático completo para la geometría elemental y sólo eso. Más bien, la elaboración de los Grundlagen la llevó a cabo teniendo en mente al menos los siguientes objetivos: 70 Obviamente, Hilbert pasa por alto la exigencia de Kant de que los axiomas sean proposiciones prácticas que contengan la síntesis a través de la cual nos damos un objeto y producimos su concepto. Comparemos, por ejemplo, el axioma 1 del grupo I de Hilbert con el primer postulado de Euclides: Axioma I.1. Dos puntos distintos A y B siempre determinan por completo una línea recta a. Escribimos AB = a o BA = a. Este axioma no trata ni con construcciones ni con esquemas de ninguna clase; no dice, como el de Euclides, “Trazar una línea recta desde un punto cualquiera a otro punto cualquiera”. Más bien, establece una relación de determinación entre ciertos objetos (la de una “recta” que depende de dos “puntos”) los cuales, por lo demás, permanecen indefinidos. 71 Frege, 80, pp. 31-51. La cita textual es: “Dadas sus definiciones [implícitas], no sé cómo decidir la cuestión de si mi reloj de bolsillo es un punto.” 72 En la filosofía contemporánea de las matemáticas, una importante corriente es la del estructuralismo, según el cual las matemáticas constituyen una ciencia que investiga las estructuras generales, es decir, sistemas de relaciones entre objetos que, por otra parte, pueden quedar sin especificar. Es más, el estructuralismo no suele poner restricciones a las cosas que pudieran ejemplifica a tales estructuras, pero tampoco le encuentra sentido considerar por separado a los objetos de una estructura o sistema, pues estos no tienen propiedades internas o constitución propia. Lo único que importa es cómo se relacionan entre sí. En los hechos, el álgebra moderna adopta esta postura, cuyo espíritu la anima en todo momento. 1.6. L A GEOMETRÍA EN LOS Grundlagen der Geometrie DE H ILBERT 49 1. investigar innumerables sistemas de geometría (junto con sus modelos) mediante la variación de los axiomas (v. gr., sustituyéndolos por sus negaciones);73 2. construir una aritmética de segmentos sobre la base de los teoremas de Pascal y Desargues sin recurrir a las nociones de congruencia y continuidad. A esto corresponde la exigencia de introducir internamente coordenadas en distintos espacios geométricos (proyectivos, afines, etc.) sin la ayuda de nociones métricas; 3. explorar la relación entre los teoremas de Desargues y Pascal y los axiomas relativos a la incidencia y la congruencia, e investigar el papel de estos teoremas en la “algebrización” de la geometría, incluyendo la introducción de coordenadas y la construcción de modelos algebraicos; 4. explorar el alcance semántico de los axiomas mediante la “construcción” de modelos (principalmente aritméticos) y abordar en este contexto la cuestión de la independencia de los axiomas (al respecto, pronto veremos un ejemplo: el de un sistema no arquimedeano); 5. examinar el lugar y la importancia de los axiomas de continuidad en la geometría. Esta lista está lejos de incluir todas las razones que llevaron a Hilbert a investigar los fundamentos de la geometría. No obstante, las cuestiones recién enumeradas explican en gran parte la manera en que agrupa los axiomas. Por ejemplo, el interés por investigar los teoremas de Desargues y Pascal explica la introducción de tres de los grupos, los relativos al orden, la incidencia y la congruencia, pues en su momento no era claro por qué las pruebas conocidas de estos resultados se apoyaban en teoremas métricos como, por ejemplo, el de Menelao, o en suposiciones como la de que el plano está inmerso en un espacio tridimensional. Por principio, la geometría proyectiva sólo se debería ocupar de cuestiones relacionadas con la incidencia y el orden, pero no con la congruencia. Como veremos, esta cuestión, la relativa a la pureza del método, constituyó un importante tema con relación a la geometría proyectiva en la segunda mitad del siglo XIX. Volviendo al marco conceptual de los Grundlagen, en él la teoría se piensa como una trama de conceptos cuyas relaciones se han de desplegar mediante la sola lógica. Es aquí donde Hilbert pone en movimiento la idea de que los axiomas no son sino moldes vacíos que se pueden llenar con distintos contenidos, es decir, que se pueden “leer” de distintas maneras asociando a los términos primitivos otros objetos que los habituales, y a cada relación lógica entre tales términos una colección de “hechos” entre tales objetos. La teoría de modelos tiene como base este nuevo modo de concebir la teoría, pues se apoya en la idea de interpretar sus enunciados en distintos dominios. Asimismo, 73 En este contexto la geometría proyectiva plana se puede generar a partir de los axiomas I.1, I.2, la negación del axioma III de las paralelas (en la modalidad expresada precisamente por el axioma A2) y una pequeña modificación del axioma I.7, en la que se pide que en cada línea haya al menos tres puntos. 50 1. E UCLIDES , K ANT, H ILBERT Y ... nada hay que impida omitir algunos axiomas o sustituirlos por su negación, abriéndose así la posibilidad de desarrollar innumerables alternativas: geometrías no euclidianas, geometrías no arquimedeanas, espacios proyectivos, espacios afines, etc. Permite también reconstruir la teoría de proporciones y de áreas planas de Euclides con un ojo puesto en los principios y las nociones utilizadas, y aclarar los vínculos entre la geometría y el álgebra (v. gr., cómo construir un cálculo de segmentos con estructura de campo; cómo introducir coordenadas en la geometría sintética; cómo construir un espacio geométrico a partir de una estructura algebraica). Tales objetivos fueron decisivos al momento de elegir las nociones y los axiomas sobre los que se basa la obra. A manera de ejemplo, en la siguiente sección presentamos una cuestión tomada de los Grundlagen. Se trata de la “construcción” de una geometría no arquimedeana mediante la cual se prueba la independencia del axioma de continuidad. 1.6.4. Independencia del axioma de continuidad Consideremos dos conjuntos denotados con Ω y Ω(t), respectivamente. El primero de ellos consta de todos los números que se pueden obtener a partir de la unidad aplicando un número finito √ de veces las operaciones de suma, resta, multiplicación, división y la operación 1 + ω 2 donde ω representa un número obtenido previamente con estas reglas. El segundo de ellos consta de todas las funciones algebraicas en la variable t que se pueden obtener a partir de t mediante√las operaciones aritméticas de suma, resta, multiplicación, división y la operación 1 + ω 2 , donde ω es cualquier función previamente generada con estas reglas. Se trata de un conjunto numerable en el que no hay la posibilidad de números imaginarios, pues en todas las aplicaciones de la quinta regla el valor otorgado al radicando 1 + ω 2 es positivo. Por tanto, en este dominio sólo “habitan” funciones reales univaluadas de t. Nótese que Ω ⊂ Ω(t). Sea c una función de Ω(t). Dado que c es una función algebraica, no se puede anular más que en un número finito de valores de t, de tal modo que para valores positivos suficientemente grandes de este parámetro se mantendrá siempre positiva o siempre negativa. Pensemos ahora en estas funciones como una clase especial de números. Obviamente, en este dominio se cumplen todas las reglas ordinarias de operación. Si a y b son dos números distintos de este sistema, decimos que a es mayor (menor) que b cuando la diferencia a − b es siempre positiva (negativa) para valores muy grandes de t. Esto permite ordenar los elementos de Ω(t) conforme a su magnitud en forma similar a como se ordenan los números reales. Es más, en este sistema la desigualdad no se destruye al sumar números iguales a ambos miembros, siempre que los números sumados sean positivos. 1.6. L A GEOMETRÍA EN LOS Grundlagen der Geometrie DE H ILBERT 51 Si n es un número natural positivo, la desigualdad n < t siempre se cumple en Ω(t), pues t − n (como función de t) es invariablemente positiva para valores suficientemente grandes de t. Esto lo podemos expresar así: los números 1 y t (ambos mayores que cero) tienen la propiedad de que cualquier múltiplo del primero siempre es menor que el segundo. Esta es la raíz del no cumplimento de la propiedad arquimedeana en el siguiente espacio G que definimos con base en Ω(t). Puntos. Los puntos de G son todas las ternas (x, y, z) de elementos de Ω(t). Planos. Los planos de G son todas las razones (u : v : w : r) donde u, v, w y r pertenecen a Ω y u, v, w no son todos cero. Incidencia. Un punto (x, y, z) incide en un plano (u : v : w : r) si y sólo si satisface la ecuación ux + vy + wz + r = 0. Líneas. Una línea es cualquier conjunto de puntos que inciden simultáneamente con dos planos dados. Por ejemplo, las razones [1 : 2 : 3 : 2] y [3 : 2 : −1 : 1] determinan dos planos π1 y π2 con ecuación x + 2y + 3z + 2 = 0 y 3x + 2y − z + 1 =√0, respectivamente. Eliminando la variable y entre ambas ecuaciones y tomando x = 1 + t 2 obtenemos la solución √ √ 2 + 5 2 1 + t2 − 1 1 + t 10 ( 1 + t 2, − , ) 8 4 Tenemos, por tanto, un punto perteneciente a la recta determinada por ambos planos. Nótese que este “punto” consiste en una terna ordenada de funciones racionales en la variable t. Para cada valor de esta variable lo que resulta es una terna de números que satisface un sistema de dos ecuaciones en el sentido ordinario.√V. gr., si t = 0 lo que resulta es la terna de números (1, −15/8, 1/4), y cuando t = 8 la terna correspondiente es (3, −35/4, 5/4). Nótese que la representación usual de estas ecuaciones en R3 sólo es posible para cada valor específico de t, pero no en general. No debemos perder de vista que los objetos referidos en las ecuaciones a través de las coordenadas son puntos del espacio G, y no los puntos de R3 sugeridos por esta clase de ecuaciones en la geometría analítica. Es más, por el momento no contamos con una representación visual del espacio G; lo único que tenemos son los conceptos que lo definen. Al respecto, es posible definir el segmento entre dos puntos dados, el ángulo entre dos segmentos y la relación “x está entre y y z” para cualesquiera tres puntos sobre una línea dada de modo que el sistema resultante satisfaga los axiomas de los grupos I-IV, pero no el axioma V de Arquímedes. La idea de cómo definir la relación “estar entre” resulta de una analogía con la geometría analítica tridimensional. En efecto, si pensamos las ecuaciones ax + by + cz = 0 y a x + b y + c z = 0 en el sentido tradicional (tomando d = d = 0 por el momento), entonces el vector w = v × v (producto cruz), donde v = (a, b, c) y v = (a , b , c ), es paralelo a los planos representados por las ecuaciones y, por ende, a la recta l determinada por ellos. Podemos w, por tanto describir paramétricamente a los puntos de la recta l en la forma P = kw 52 1. E UCLIDES , K ANT, H ILBERT Y ... donde k ∈ Ω(t) (nótese que el vector w no depende del valor que demos a la variable t o al parámetro k, pues es una función de los coeficientes a, b, c, a , b , c ). Con base en esta idea podemos ordenar los puntos de l conforme al orden de los correspondientes parámetros. V. gr., si P1 = k1 w , P2 = k2 w , P3 = k3 w y k1 < k2 < k3 , entonces P2 está entre P1 y P3 (de hecho, con base en esta idea se puede definir la noción de segmento sobre la recta l). Consideremos ahora los planos determinados por las razones [1, −1, 0, 0] y [0, 1, −1, 0]. La correspondiente línea l contiene a todos los puntos del conjunto Φ = {(a, a, a)|a ∈ Z} así como al punto T = (t,t,t). Al respecto, T no está entre ningún par de elementos de Φ, como se desprende de lo dicho en el párrafo anterior y al inicio de este apartado. En otras palabras, para ningún par de enteros m y n se tiene que T está entre (m, m, m) y (n, n, n). Para cada n, denotemos con An al punto (n, n, n) de l. En la serie de puntos A0 , A1 , A2 , . . . , An , . . . no hay un punto B con la propiedad de que T está entre A0 y B. Por lo tanto, el axioma V.1 (axioma de Arquímedes) no se cumple en G, con lo cual concluye la demostración de su independencia con relación a los demás axiomas. Obsérvese que el espacio G nos enfrenta con la imposibilidad de visualizar los objetos geométricos considerados, los cuales sólo los podemos pensar y manipular mediante la aritmética y el álgebra. No obstante, esta limitante no es un impedimento para que por deducción podamos conocer de ellos. Este es el sentido de la axiomática moderna, la cual cuenta con el respaldo de la teoría de la cuantificación.74 En la concepción de Hilbert el vínculo entre las teorías formales y las estructuras matemáticas trabaja en dos sentidos: por una parte, de las estructuras (i) sacamos los problemas (los teoremas) que buscamos resolver (probar) con la teoría, y (ii) extraemos los conceptos que buscamos formalizar; por la otra, con los modelos exploramos los alcances semánticos de la teoría y, por ende, los vínculos lógicos entre los conceptos que la conforman. En la siguiente sección, más bien extensa, abordamos un problema planteado por Wiener en su conferencia de 1891 y la manera en que Hilbert lo resuelve. Esto es relevante para nosotros, pues ilustra nuestra afirmación de que Hilbert organiza la teoría tomando en cuenta ciertos problemas lógicos y matemáticos que quiere resolver. 1.6.5. El teorema de Desargues y su lugar en la geometría Sin lugar a dudas, entre los problemas que Hilbert tuvo en mente al organizar los Grundlagen se hallaban los relativos al teorema de Desargues, el cual había mostrado ser una pieza fundamental en la geometría afín y proyectiva, y un elemento cuya inserción lógica en las mismas constituía un problema. Aclarar el lugar de este teorema en dicho contexto era una necesidad ya expresada por Wiener en 1891. 74 De hecho, la teoría de modelos actual tiene como principal soporte la concepción semántica de la verdad de Tarski para los lenguajes formales, la cual fue formulada ex profeso para las fórmulas de la lógica de primer orden. 1.6. L A GEOMETRÍA EN LOS Grundlagen der Geometrie DE H ILBERT 1.6.5.1. 53 El teorema de Desargues El teorema de Desargues es un resultado perteneciente originalmente a la geometría proyectiva. Dice lo siguiente: Dos triángulos están en perspectiva desde un punto si y sólo si están en perspectiva desde una línea recta.75 Asociado a él se halla una notable figura en la que los vértices ABC de un triángulo se proyectan en los vértices A B C de otro triángulo por medio de rectas originadas en un punto O (perspectiva central). Figura 1.4 En la figura, los lados de los triángulos se prolongan hasta intersecarse. Un hecho sorprendente es que los puntos de intersección P, Q, R de los lados correspondientes están alineados (perspectiva axial, Figura 1.4). Esto último es, en parte, lo que dice el teorema. Otro hecho sorprendente es que si bien la figura anterior se halla en un plano, se le puede pensar de otra manera. Podemos imaginar, por ejemplo, que la Figura 1.4 es la proyección plana de una configuración tridimensional (i. e., que es un dibujo de algo que vemos en el espacio). En efecto, podemos imaginar que el triángulo ABC está en el espacio y que el cuadrángulo OABC es en realidad un tetraedro (Figura 1.5). De manera semejante, OA B C sería Figura 1.5 75 Una forma más coloquial de este teorema es la siguiente: Si dos triángulos ABC y A B C están situados de modo tal que las líneas AA , BB y CC convergen en un punto, entonces los pares de lados AB − A B , AC − A C y BC − B C se intersecan en una misma línea recta, e inversamente. Si el lector no sabe nada acerca de este teorema, puede comenzar con la ficha “Teorema de Desargues” de Wikipedia, para después continuar con los textos (Courant, 1941), (Lehmer, 2005), (Coxeter, 1987) y (Bennett, 1995), quizá en ese orden. Aquí apenas si daremos alguna información en torno a las nociones implicadas, como, por ejemplo, las de “triángulos en perspectiva” y “razón cruzada”. Al respecto hay mucha información en Internet y en la literatura matemática. 54 1. E UCLIDES , K ANT, H ILBERT Y ... otro tetraedro cuya base A B C estaría en perspectiva con ABC desde O. Esto último significa que un observador ubicado en O sólo percibiría un triángulo, pues desde esa posición ABC se miraría sobrepuesto a A B C . Conforme a esta segunda línea de pensamiento los triángulos ABC y A B C están en dos planos distintos Π y Π , los determinados por sus vértices. Lo anterior permite una prueba muy simple del teorema (Figura 1.6). La línea AB se halla en Π, mientras que la línea A B se halla en Π , de modo que su punto de intersección P está en ambos planos, e incide por tanto con la línea l en la que éstos se intersecan. Lo mismo sucede con las otras dos parejas de líneas AC − A C y BC − B C , cuyas intersecciones Q y R también se hallan en la recta l (la cual puede ser la recta al infinito). Figura 1.6 Resulta entonces que los puntos P, Q y R inciden con una misma línea, es decir, son colineales. En cuanto al hecho de que las líneas correspondientes se intersecan, esto lo podemos obviar advirtiendo, por ejemplo, que los puntos O, A, B, A y B se hallan todos en un mismo plano, el cual no es otra cosa que una de las caras del tetraedro, sucediendo lo mismo con las otras quintetas de puntos {O, A,C, A ,C } y {O, B,C, B ,C }. 1.6.5.2. Una prueba del teorema de Desargues en el plano En el pasaje anterior hemos delineado una prueba del teorema de Desargues con base en la idea de que los triángulos ABC y A B C están en el espacio. No obstante, esta última suposición es prescindible, en el sentido de que podemos probar el teorema evitando el elemento espacial, i. e., tratando la Figura 1.4 como un arreglo bidimensional. Un ejemplo es la siguiente demostración basada en el teorema de Menelao, el cual proporciona un criterio para determinar si tres puntos están alineados. Dice lo siguiente: 1.6. L A GEOMETRÍA EN LOS Grundlagen der Geometrie DE H ILBERT 55 Proposición 1. Tres puntos P, Q, R correspondientes a los lados AB, BC y CA de un triángulo están alineados si y sólo si AP BQ CR · · = −1 PB QC RA Consideremos de nuevo la Figura 1.4 Con relación a los triángulos OAB, OAC y OBC, las líneas B A P, A C Q y B C R son, respectivamente, transversales a sus lados (en el dibujo hemos resaltado el triángulo OBC y su transversal B C R). Por repetidas aplicaciones del teorema de Menelao tenemos que AP BB OA · · = −1 PB B O A A (transversal B A P de OAB) CQ AA OC · · = −1 QA A O C C (transversal A C Q de OAC) BR CC OB · · = −1 RC C O B B (transversal B C R de OBC) Multiplicando miembro a miembro las tres igualdades anteriores resulta que AP CQ BR · · = −1 PB QA RC De lo anterior se sigue, por el teorema de Menelao, que los puntos P, Q y R son colineales. La prueba anterior presenta una cuestión de orden lógico. Al examinarla desde el punto de vista de la pureza del método podemos ver que en ella hemos recurrido a la noción de distancia (que no es proyectiva) por razón del teorema de Menelao (el cuál atañe a cocientes formados con las longitudes de ciertos segmentos), siendo que el teorema de Desargues no trata con nociones métricas (en él sólo se alude a cuestiones proyectivas 56 1. E UCLIDES , K ANT, H ILBERT Y ... como la incidencia y la colinealidad). Queda la pregunta de si habrá una demostración del teorema en la que se prescinda de tales nociones y del elemento espacial (es decir, en la que no se suponga que los triángulos ABC y A B C están en el espacio). Esta cuestión, planteada por Wiener en la conferencia de 1891, la aborda Hilbert en el capítulo V de los Grundlagen. Antes de ver cómo lo hace, expliquemos la importancia de este teorema en la geometría. 1.6.5.3. Puntos armónicos y teorema de Desargues Una pregunta fundamental en la geometría proyectiva es la siguiente: ¿Qué se conserva por proyección, cuando no lo hacen ni la longitud ni los ángulos? Aunada a ella se encuentra esta otra interrogante: ¿Cuándo una figura se puede proyectar en otra? Comenzando por los elementos más simples, los puntos y las líneas, el llamado teorema fundamental de la geometría proyectiva tiene una respuesta a esta última pregunta: Proposición 2. Dadas dos líneas rectas, existe un único mapeo proyectivo que transforma tres puntos dados de la primera en tres puntos dados de la segunda. En el caso de cuatro puntos alineados A, B, C, D la respuesta es sorprendente: Proposición 3. Cuatro puntos alineados A, B, C, D se pueden transformar proyectivamente en otros cuatro puntos alineados A’, B’, C’, D’ si y sólo si la razón doble76 de los primeros es la misma que la de los segundos, es decir, sí y sólo si AC DB A C D B · = · CB AD C B A D No deja de ser extraño que una noción como la razón doble, originada en consideraciones métricas, resulte el invariante más importante de la geometría proyectiva, que la desdeña.77 Se trata, de hecho, de la única invariante numérica conocida. Esto nos lleva de nuevo a una cuestión a la que se le dio gran importancia en el siglo XIX, la cuestión de la pureza del método: ¿Acaso la geometría proyectiva no debería ser independiente de las nociones métricas? Al respecto, en ese tiempo se halló la manera de caracterizar las hileras armónicas sin recurrir a la noción de longitud de segmentos. Esto se logró a través del siguiente teorema: 76 En la geometría euclidiana la razón doble (AB,CD) de cuatros puntos colineales A, C, B, D es un cociente de cocientes, el (AC/CB)/(AD/DB), el cual escribimos como (AC/CB) · (DB/AD). En él se compara la razón en que el punto C divide al segmento AB con la razón en que el punto D divide al mismo segmento. Al respecto, cuando los puntos C y D dividen a AB interna y externamente en la misma razón (salvo por el signo), se dice que A, C, B, D es una hilera armónica (o que D es el conjugado armónico de C con respecto a A y B). En tal caso la razón doble es igual a −1. 77 En cuanto a las razones por las que la razón cruzada es el invariante proyectivo más importante, en (Ramírez Arturo, 2008, cap. 7) hay una detallada explicación. 1.6. L A GEOMETRÍA EN LOS Grundlagen der Geometrie DE H ILBERT 57 Proposición 4. Cuatro puntos A, C, B, D sobre una línea recta forman una hilera armónica si y sólo si se puede construir un cuadrángulo PQRS con respecto al que A, C, B y D están determinados por las relaciones de incidencia que se muestran en la siguiente figura: Las relaciones son: (i) que A y B son los puntos de intersección de pares de lados opuestos del cuadrángulo PQRS, y (ii) que las diagonales del cuadrángulo intersecan a m en C y D. De este resultado deriva un método para construir un cuarto punto armónico D toda vez que se tienen tres puntos colineales A, C, B. El método se puede explicar con base en la figura anterior. Tómense como punto de partida los puntos A, C, B y la línea m. Por dichos puntos trácense respectivamente tres rectas no concurrentes a, c, b formando un triángulo PQR; después, trácense r = l(A, R) y p = l(B, P). Si S es el punto de intersección de r y p, entonces la línea l(Q, S) = d interseca a m en D, el punto buscado.78 El método recién indicado sólo se sirve de relaciones de incidencia. Por tanto, se tiene una caracterización proyectiva de las hileras armónicas.79 Queda por resolver el problema de la unicidad del cuarto armónico. En efecto, ¿qué sucede si se traza otro cuadrángulo P Q R S como en la Figura 1.7 ?, ¿se llega al mismo punto D? Figura 1.7 78 El primero en utilizar este método del cuadrángulo completo para construir el cuarto armónico fue von Staudt en 1847. 79 La importancia de la noción de “hilera armónica” se pone de manifiesto en la definición misma de proyectividad: Una proyectividad entre dos líneas X e Y es una correspondencia f : X → Y que preserva la relación armónica, es decir, tal que si A, B, C, D es una hilera armónica, entonces f (A), f (B), f (C), f (D) también es una hilera armónica (v. Coxeter, 1992, p. 40). 58 1. E UCLIDES , K ANT, H ILBERT Y ... La cuestión anterior se resuelve con el teorema de Desargues y la respuesta es afirmativa: el punto D es único. En efecto, al observar la Figura 4 se verá que, por construcción, los triángulos PQR y P Q R están en perspectiva desde la recta m (siendo A, C y B los puntos donde convergen los lados correspondientes). Por el teorema de Desargues hay un punto O desde el cual los vértices del triángulo P Q R se proyectan en los vértices del triángulo PQR. De la misma manera, los triángulos PRS y P R S están en perspectiva desde m (donde, nuevamente, A, C y B son los puntos donde convergen los lados correspondientes), por lo que hay un punto O desde el cual P R S se proyecta en PRS. Ahora bien, las líneas RR y PP concurren en ambos centros de proyección O y O , por lo que estos puntos son el mismo. Así, los triángulos PQS y P Q S están en perspectiva desde O, de modo que, por el teorema de Desargues, el punto de intersección de QS y Q S es colineal con A y B. Pero dicho punto de intersección es D. Como se ve, el teorema de Desargues resultó una pieza central en la delicada tarea de organizar la geometría proyectiva. Es más, con el paso del tiempo su importancia aumentó por múltiples razones. Dos de ellas son significativas para este trabajo: su compleja relación con los axiomas básicos de la geometría proyectiva, una tarea en la que Hilbert y otros geómetras trabajaron arduamente en el siglo XIX, y los vínculos que permitió establecer entre la geometría y otros dominios de las matemáticas. En lo que sigue habremos de ahondar en estas cuestiones. 1.6.5.4. El teorema de Desargues en el espacio afín Si bien el teorema de Desargues enuncia una propiedad proyectiva, se le puede formular con relación a un espacio afín;80 para ello se tienen dos casos: el paralelo y el no paralelo. El primero de ellos es el siguiente: Teorema de Desargues81 Si en el espacio (en el plano) dos triángulos (ABC) y (A B C ) están situados de modo que las líneas AA , BB y CC que unen los vértices homólogos pasan por un mismo punto O, y si los lados homólogos AB − A B y AC − A C son paralelos entre sí, entonces los lados homólogos restantes BC y B C también son paralelos entre sí.82 80 Un espacio afín se caracteriza por la propiedad de la paralela única, para lo cual no es necesario contar con la noción de ángulo ni con la noción de longitud o medida (es decir, en un sentido estricto los postulados 3 y 4 de Euclides no significan nada en un espacio afín). En términos de transformaciones, una propiedad es afín cuando ésta se conserva bajo cualquier transformación paralela de un plano a otro. Podemos decir que la geometría afín es una generalización de la geometría euclidiana caracterizada por distorsiones en la inclinación y la escala. 81 Nuevamente se trata de dos teoremas que, por similitud, se designan bajo un mismo nombre: uno acerca de configuraciones espaciales, y otro acerca de configuraciones en el plano. 82 Notación. Con (ABC) se denota el triángulo con vértices A, B, C; con AB se denota la línea determinada por los puntos A y B, y con ABC el plano determinado por tres puntos no colineales A, B, C. 1.6. L A GEOMETRÍA EN LOS Grundlagen der Geometrie DE H ILBERT 59 Esta formulación corresponde al teorema 32 de los Grundlagen. Como consecuencia del axioma de las paralelas el espacio en cuestión es un espacio afín. Aquí también hay una demostración simple del teorema en el caso tridimensional. Veamos.83 Por el teorema II (ver nota 81 al pie), ABC||A B C . De lo anterior se sigue que BC y B C no se intersecan, pues de lo contrario los planos ABC y A B C no serían paralelos. Por otra parte, como BB y CC concurren en O, los puntos B, B , C y C son coplanares (teorema I). Por tanto, BC y B C pertenecen a un mismo plano y no se intersecan. De esto se sigue que BC||B C . Es de esperarse que en el plano el teorema de Desargues se pruebe a partir del axioma de las paralelas y los axiomas de incidencia para el plano (axiomas I.1 y I.2). No obstante, la cosa no es así. Para evidenciar este hecho mostramos un plano afín en el que dichos axiomas son válidos, pero no el teorema. Se trata del plano de Moulton,84 una estructura R2 , L, I donde R2 es el plano real, L es un conjunto de líneas que a continuación definimos, e I es la relación de incidencia entre puntos y líneas que se realiza cuando las coordenadas de un punto satisfacen la ecuación de la línea. Veamos. Los elementos de L son los siguientes: 1. Las rectas verticales y horizontales del plano real; 2. las rectas con pendiente positiva del plano real; 3. las líneas quebradas del plano real formadas por dos semirrectas que se unen en el eje Y y cumplen lo siguiente: la semirrecta a la izquierda del eje Y tiene pendiente negativa m, en tanto que la semirrecta a la derecha del eje Y tiene pendiente 2m (refracción en el eje Y ). Figura 1.8. Ilustración del plano de Moulton El plano de Moulton satisface el axioma de las paralelas, los axiomas de orden (grupo II) y los axiomas I.1-I.3 de incidencia para el plano.85 No obstante, como a continuación se muestra, en él no se cumple el teorema de Desargues. 83 En la prueba nos servimos de los siguientes teoremas, los cuales se demuestran a partir de los axiomas del grupo I (axiomas de incidencia): Teorema I. Si dos líneas m y n concurren en un punto P, entonces hay un plano π que las contiene. Teorema II. Sean (A, B,C) y (A , B ,C ) dos ternas de puntos no colineales. Si AB||A B y BC||B C , entonces ABC||A B C (caso de paralelismo entre planos). 84 Al respecto véase la correspondiente ficha en Wikipedia. 85 Por ejemplo, dado un par de puntos (x , y ) y (x , y ), con x ≤ 0 < x y y < y , para hallar la línea 0 0 1 1 0 1 1 0 60 1. E UCLIDES , K ANT, H ILBERT Y ... Figura 1.9 En la Figura 1.9 dos triángulos de Moulton ABC y A B C están en perspectiva desde el origen O y los lados homólogos AB − A B y AC − A C son paralelos entre sí. No obstante, los lados BC − B C no son paralelos entre sí, pues se intersecan en D.86 Esto es un contraejemplo al teorema de Desargues. De lo anterior se sigue que: 1. El (caso paralelo del) teorema de Desargues es independiente del axioma de las paralelas y los axiomas de orden e incidencia para el plano, pues el plano de Moulton es un modelo de dichos axiomas y en él no se cumple el teorema. 2. Al extender el plano de Moulton a un plano proyectivo mediante la adición de los puntos y la recta al infinito, lo que resulta es un plano proyectivo no arguesiano que, por lo mismo, no es isomorfo al plano proyectivo RP2 . Un modelo similar a este permitió a Hilbert demostrar en los Grundlagen la independencia del teorema de Desargues con relación a los axiomas de incidencia y orden para el plano. Entre los resultados alcanzados se encuentran los siguientes: a) El teorema de Desargues para el plano afín se puede demostrar a partir del axioma de las paralelas, los axiomas de orden e incidencia para el plano (axiomas I.1-I.2) y los axiomas de congruencia (grupo III) (v. gr., con base en el teorema de Menelao). b) Sea G una geometría plana que satisface el axioma de las paralelas, los axiomas de orden y los axiomas de incidencia para el plano (axiomas I.1-I.3). Una condición necesaria y suficiente para que G sea parte de una geometría espacial que cumple con los axiomas de los grupos I, II y IV es que satisfaga el teorema de Desargues. Esto último permite, postulando el teorema de Desargues, establecer un plano proyectivo que cumple con las propiedades de Moulton que incide con ellos, tal como lo afirma el axioma I.1, basta con resolver para m y b el sistema de ecuaciones y0 = mx0 + b; y1 = 2mx1 + b, el cual siempre tiene una única solución. 86 Todo esto se puede probar algebraicamente, como un ejercicio de geometría analítica. 1.6. L A GEOMETRÍA EN LOS Grundlagen der Geometrie DE H ILBERT 61 establecidas en los grupos I, II y IV y es extensible a un espacio con un mayor número de dimensiones. c) El teorema de Desargues para el plano afín se puede demostrar a partir del axioma de las paralelas y los axiomas de incidencia toda vez que se incluyan los axiomas espaciales I.4-I.8.87 Por tanto, si lo que se busca es evitar los axiomas de congruencia en la prueba del teorema de Desargues, no hay otro camino que admitir el elemento espacial. Lo anterior pone de manifiesto cierta insuficiencia en la teoría ya señalada por Wiener en 1891, una especie de laguna en los axiomas de incidencia para el plano: ¿Por qué la prueba de un teorema proyectivo en el plano requiere de una noción como la de congruencia, la cual equivale al concepto métrico de longitud?; ¿por qué la única manera de evitar los axiomas de congruencia es suponiendo que el plano está inmerso en un espacio con un mayor número de dimensiones? De hecho, el plano es el único lugar donde el teorema de Desargues puede fallar, lo cual no deja de ser un descubrimiento singular. En todo esto hay un modo muy peculiar de pensar el teorema de Desargues: lo relevante ya no es la pregunta por su verdad, sino su relación con los axiomas. Y esto no es todo. Como a continuación veremos, el teorema resultó una pieza clave en la coordenatización de la geometría sintética y en la construcción de un álgebra de segmentos en los espacios afín y proyectivo. 1.6.5.5. Un álgebra de segmentos Veamos cómo establece Hilbert un álgebra de segmentos en el plano afín. Esto se relaciona con la siguiente pregunta: ¿qué se requiere geométricamente para tener una estructura de campo ordenado en la recta? Como veremos, el teorema de Desargues es una pieza fundamental en esta tarea. Para ello supongamos una geometría afín plana que cumple con los axiomas de orden e incidencia para el plano.88 Con base en estos axiomas podemos definir una operación de suma para los segmentos de una línea recta l como sigue. Sea m una línea recta que interseca a l en un punto O (Figura 1.10). Con base en m se puede definir un cálculo de segmentos sobre l como sigue. Tómense dos segmentos OE y OE sobre l y m, respectivamente;89 estos segmentos actuarán como unidades en el álgebra. Se escribe OE = OE = 1. Sean A y B dos puntos sobre l. La suma de 87 En este caso, la configuración bidimensional (dos triángulos en perspectiva en un mismo plano, etc.) se puede considerar como la proyección de una configuración tridimensional, y utilizar este hecho para demostrar el teorema en el plano. 88 Nos referimos a los axiomas I.1, I.2, todos los axiomas del grupo II y el axioma IV del apéndice C. 89 Aquí la escritura se vuelve ambigua: la notación AB se utiliza tanto para designar al segmento con extremos A y B como a la recta por A y B, reconociéndose el sentido que se le da por el contexto. 62 1. E UCLIDES , K ANT, H ILBERT Y ... los segmentos a = OA y b = OB se define como sigue (donde las letras con comilla indican puntos pertenecientes a m): 1. Sea AA la paralela a EE por A; 2. Sea p la paralela a l por A y q la paralela a m por B. p y q no son paralelas y se intersecan en un punto X; 3. Sea n la paralela a EE por X. n no es paralela a l y la interseca en un punto C. Por definición, el segmento c = OC es la suma de OA y OB. Escribimos OC = OA + OB (o bien, a + b = c).90 Figura 1.10 Las propiedades algebraicas de esta operación dependen de los axiomas aceptados. En particular, la conmutatividad de la suma precisa del teorema de Desargues y su recíproco.91 En efecto, hagamos la suma OB + OA siguiendo el procedimiento recién señalado. 1. Sea BB la paralela a EE por B; 2. Sea r la paralela a l por B y s la paralela a m por A. r y s no son paralelas y se intersecan en un punto Y ; 3. Sea n la paralela a EE por Y . n no es paralela a l y la interseca en un punto que, como se probará, es C. Conforme a lo anterior se tiene: AA ||EE ||BB , A X||B Y ||OA y AY ||BX||OA . Sean A = AY ∩ A X y B = BX ∩ B Y . 90 Euclidianamente, lo que se hace es construir un triángulo BCX congruente con OAA , de modo que AC = OB. Esta idea –que encierra la noción métrica de congruencia, la cual no tiene sentido en las geometrías afín y proyectiva– constituye el fundamento heurístico de la definición anterior. 91 El recíproco del teorema de Desargues dice los siguiente: Si en el plano dos triángulos (ABC) y (A B C ) están situados de modo que sus lados homólogos AB − A B , AC − A C y BC − B C son paralelos entre sí, entonces las líneas AA , BB y CC que unen los vértices homólogos son paralelas entre sí o concurren en un punto. Este teorema y el de Desargues son equivalentes entre sí, por lo que se les designa con el mismo nombre. 1.6. L A GEOMETRÍA EN LOS Grundlagen der Geometrie DE H ILBERT (a) 63 (b) Figura 1.11 En la Figura 1.11(a) los triángulos AA A y BB B tienen lados AA − BB , AA − BB y A A − B B paralelos entre sí, y están en perspectiva desde O (esto último por el recíproco del teorema de Desargues), de modo que O, A y B son colineales. En consecuencia (Figura 1.11(b)), los triángulos OAA y B Y X están en perspectiva desde A , y como los lados homólogos OA − XB y OA −Y B son paralelos entre sí, conforme al teorema de Desargues los lados homólogos AA y XY son paralelos entre sí. Ergo la línea n es la paralela a EE por X, es decir, es la línea n que interseca a l en C en la Figura 1.10. Pero este último punto es el que determina la suma de OB con OA. Por tanto, OB + OA = OC. Como se ve, la propiedad conmutativa de la suma se debe al teorema de Desargues. De hecho se tiene el siguiente resultado: Proposición I. En todo plano afín arguesiano,92 el álgebra de segmentos sobre cualquier línea recta es un anillo con división.93 Conclusión: Para que el álgebra de segmentos tenga una estructura de anillo con división es necesario postular la propiedad arguesiana, incluir los axiomas de congruencia, o admitir los axiomas espaciales de incidencia. Obviamente, desde la perspectiva de la pureza del método, la primera opción es preferible. En cuanto a un álgebra con estructura de campo, es indispensable la validez del teorema de Pappus. Esto lo resumimos en la siguiente proposición: Proposición II. El teorema de Pappus se cumple en un plano afín arguesiano si y sólo si la multiplicación de segmentos es conmutativa.94 92 Arguesiano: que el teorema de Desargues vale en dicho plano. multiplicación de segmentos se puede introducir en forma análoga a la suma (cosa que aquí no haremos), y con base en ella es que nos referimos al álgebra de segmentos como un anillo. 94 Recordemos que un anillo con división es un campo cuando la multiplicación es conmutativa. Por tanto, el álgebra de segmentos en un plano afín arguesiano será un campo si y sólo si se satisface el teorema de Pappus. 93 La 64 1. E UCLIDES , K ANT, H ILBERT Y ... Al respecto, se sabe que el teorema de Pappus implica al teorema de Desargues, pero no a la inversa (para el caso hay contraejemplos). Aquí también, el teorema de Pappus sólo se puede demostrar a partir de los axiomas espaciales de incidencia, o de los axiomas de incidencia para el plano junto con los axiomas de congruencia. Por tanto, hay al menos tres caminos para dar lugar a una suma y multiplicación de puntos en la recta con estructura de campo: (a) Postular el axioma de las paralelas junto con los axiomas de congruencia y los axiomas de incidencia para el plano; (b) Postular el axioma de las paralelas junto con los axiomas de incidencia para el plano y el espacio; o (c) Postular el teorema de Pappus junto con el axioma de las paralelas y los axiomas de incidencia para el plano. ¿Cuál es la mejor opción? Decidir esta cuestión es un asunto de quien hace uso de la geometría. 1.6.6. Un recorrido a la inversa Las investigaciones precedentes no fueron todo. Por el contrario, Hilbert descubrió la manera de transitar del álgebra a la geometría invirtiendo el camino, es decir, construyendo planos afines a partir de ciertas estructuras algebraicas. También halló la manera de introducir coordenadas en el plano afín sintético, es decir, de asociar a cada punto P del plano afín una única pareja (x, y) de elementos tomados de un conjunto Γ con una estructura algebraica similar a la del cálculo de segmentos.95 Al respecto, una de las ideas originales era introducir los números reales en la escena. Esto forma parte de los inicios de la geometría algebraica, en los que el teorema de Desargues desempeñó un importante papel. Lo que sigue es una breve nota en torno a estas cuestiones. La proposición I recién expuesta indica cómo establecer un álgebra con estructura de anillo de división entre los segmentos de cualquier recta en un plano afín arguesiano. Veamos ahora la manera de invertir el camino, es decir, de obtener un plano afín arguesiano con base en un anillo de división D. Los puntos del plano en cuestión son los elementos de D × D. Si a, b, c son tres elementos de D, con a y b no ambos cero, el conjunto l(a, b, c) = {(x, y)|xa + yb = c} es una línea del plano afín de la que xa + yb = c es una ecuación. Por ejemplo, x · 2 + y · 3 = 1 es ecuación de una línea en el plano afín Z2 . El tratamiento moderno de esta construcción se sirve del concepto de espacio vectorial izquierdo. En este enfoque los puntos del plano D 2 son vistos como vectores y D como el conjunto de escalares. El uso del adjetivo “izquierdo” obedece al hecho de que los escalares sólo multiplican a los vectores por la izquierda, es decir, que la única operación escalar 95 Con relación a cualquier espacio afín se puede probar lo siguiente: (1) todas las líneas tienen un mismo número de puntos n (donde n puede ser transfinito); (2) por cada punto pasan n + 1 líneas; (3) la relación de paralelismo es antireflexiva, simétrica y transitiva; (4) si una línea interseca a una de dos paralelas, también interseca a la otra; (5) si n es el número de puntos sobre una línea l, entonces l tiene n˘1 paralelas. Todas estas propiedades se utilizan al introducir coordenadas. 1.6. L A GEOMETRÍA EN LOS Grundlagen der Geometrie DE H ILBERT 65 utilizada es r(x, y) = (rx, ry).96 Esta manera de abordar el tema permite demostrar en forma elegante la siguiente proposición con relación al plano (P, L ), donde P = D 2 y L es el conjunto de todas las líneas l(a, b, c). Proposición III. Si D es un anillo de división, entonces el plano (P, L ) es un plano afín arguesiano. Por otra parte, si D es un campo, entonces en el plano (P, L ) se cumple el teorema de Pappus. El lector se podrá ejercitar considerando, por ejemplo, el espacio (P, L ), donde P = Z5 × Z5 . Se trata de un anillo de división el cual, a causa del teorema de Wedderburn, es un campo (el teorema dice justo eso: todo anillo de división finito es un campo). ¿Cuál es el conjunto de puntos de este espacio? ¿Cuáles son sus líneas? Verificar que se trata de un plano afín es un ejercicio de álgebra lineal. V. gr., con relación al axioma “Dados dos puntos distintos, hay una y sólo una línea que los contiene”, la cuestión se reduce a probar lo siguiente: dados (x, y) y (x , y ) distintos entre sí, hallar a, b, c ∈ Z5 tales que a y b no son ambos cero y xa + yb = c, x a + y b = c (en Z5 ), y a probar que si (x, y) y (x , y ) satisfacen cualquier otra ecuación ua + vb = c , entonces las dos ecuaciones son equivalentes. En cuanto al teorema de Desargues, la prueba de que éste se cumple en todo plano afín definido a partir de un anillo de división se halla en (Bennett, 1995). Tenemos, por tanto, un plano afín arguesiano para cada anillo con división. Además, sabemos que cuando k no es primo el plano correspondiente a Zk no es afín (v. gr., Z4 ), pues el anillo no es de división. Para concluir esta sección diremos que este tipo de investigaciones no son ajenas a los Grundlagen, sino que se llevan a cabo inspiradas en el espíritu que Hilbert imprimió a esta obra. 1.6.7. Breves reflexiones En los Grundlagen Hilbert nos muestra la importancia del teorema de Desargues no sólo al interior de la teoría, sino al vincularlo con otras ramas de la matemática. Primero nos enseña cómo se utiliza este teorema al construir un cálculo de segmentos y al introducir coordenadas en la geometría sintética; después nos deja ver el lugar que ocupa al enlazar la geometría con el álgebra, y por último nos muestra, desde la metamatemática, que dicho teorema es independiente de los axiomas de orden, 96 En general, los espacios vectoriales suelen definirse sobre un campo. No obstante, el conjunto de escalares puede ser un anillo de división mientras se tenga el cuidado de realizar la multiplicación escalar siempre del mismo lado. Cuando D es un campo, la ecuación xa + yb = c se puede escribir en la forma ax + by = c que nos es familiar. No obstante, cuando D no es conmutativo esto puede conducir a errores. Por ejemplo, si D es el conjunto H de los cuaternios de Hamilton, el par (i, k) satisface la ecuación x j = y, pero no la ecuación jx = y. Por tanto, las líneas determinadas por ecuaciones con las variables y los coeficientes invertidos no serían las mismas. 66 1. E UCLIDES , K ANT, H ILBERT Y ... incidencia y paralelismo para el plano, algo inesperado que obligó a investigar las causas de su autonomía y lo colocó en un rango similar al del quinto postulado de Euclides. Esto ilustra la clase de problemas que Hilbert aborda en los Grundlagen, y explica en gran medida los axiomas que presenta y la razón por la que elige las nociones de incidencia, orden y congruencia como básicas, es decir, la razón por la que organiza la base axiomática de esa y no de otra manera. 1.7. Hilbert y la teoría kantiana de esquemas Comparemos el punto de vista de Hilbert, en su formalismo geométrico, con la teoría kantiana del conocimiento matemático, poniendo especial atención en la teoría de esquemas. En la Crítica de la razón pura Kant sostiene que es imposible pensar los conceptos geométricos sin darles un objeto: “No podemos pensar en una línea sin trazarla en el pensamiento, ni un círculo sin describirlo, como tampoco representar tres dimensiones del espacio sin construir tres líneas perpendiculares a partir del mismo punto.” (B154). Esta simple observación es un indicativo de que la importancia de los esquemas geométricos en la epistemología matemática de Kant es superior a lo que hemos dicho. En efecto, en la sección I.4 nos hemos referido a los esquemas como instancias que permiten construir en la representación objetos en conformidad con los conceptos. Pero lo dicho por Kant en el pasaje anterior les otorga una mayor importancia: sin esquemas es imposible pensar los conceptos geométricos en absoluto, pues esta actividad precisa de una representación interna de ellos. Lo anterior no constituye ningún problema para Kant, pues para él los conceptos geométricos nacen ligados a una forma de representación.97 Pero desde la perspectiva que abre, por ejemplo, el principio de dualidad, este maridaje entre esquemas y conceptos se rompe: las “rectas” pueden ser lo que siempre fueron o lo que originalmente eran los “puntos”. Ergo los conceptos definidos por los axiomas van más allá de los esquemas, poseen una mayor generalidad, con lo que la teoría se descubre como algo más abstracto de lo previsto, como algo que ya no está indisolublemente ligado a un sistema fijo de objetos. De hecho, en la geometría de Hilbert los conceptos se piensan sin esquemas, aunque hay circunstancias en las que esto podría no ser lo más adecuado. Esta disociación entre los conceptos y sus representaciones fue justamente lo que abrió la posibilidad de pensar la teoría per se, es decir, la posibilidad de convertirla en un objeto de estudio. Esto último es lo que hace Hilbert en los Grundlagen. Lo que ahí investiga no son los objetos que dice Kant (ciertas entidades construibles en la intuición pura), sino la teoría misma. Digamos que la escudriña primariamente a ella, no a sus interpretaciones. Como ya hemos visto, esta manera de abordar la teoría señala el surgimiento de la 97 Por ejemplo, el concepto de circunferencia nace ligado al trazo de una curva de este tipo mediante un compás, o con un hilo rígido manteniendo fijo uno de sus extremos, o incluso girando nuestro cuerpo. 1.7. H ILBERT Y LA TEORÍA KANTIANA DE ESQUEMAS 67 teoría de modelos, donde el juego consiste en interpretar los términos y las relaciones fundamentales de distintas maneras. En particular, muchos modelos de la teoría geométrica y sus variantes resultan de enlazar sus conceptos con ciertos esquemas. Un notable ejemplo es el modelo de Poincaré para la geometría hiperbólica, en el que al concepto formal de línea se le asocia un esquema euclidiano de la siguiente manera: sea C una circunferencia fija en el plano euclidiano. Si X es una circunferencia que corta ortogonalmente a C, entonces el arco de X que se halla en el interior de C es una línea. Aquí el caso es que contamos con un esquema (euclidiano) para producir circunferencias ortogonales a C, y es a través de este esquema que especificamos las líneas del modelo (para una geometría que no es euclidiana). Este modo de tratar la teoría geométrica significó un cambio en el modo tradicional de llevar a cabo las investigaciones y tuvo enormes consecuencias. Para empezar, permitió una gran economía de pensamiento: cada proposición demostrada era válida en todos los modelos de la teoría, donde ya no se le tenía que investigar. Y las ganancias no se limitaron a eso. La posibilidad de interpretar la teoría de distintas maneras permitió a Hilbert explorar su conexión con otros dominios de la matemática, y los resultados fueron sorprendentes. Por ejemplo, este nuevo tratamiento lo llevó a relacionar el teorema de Desargues con las propiedades de los anillos en el álgebra; v. gr, “Si el teorema de Desargues es válido en un dominio, entonces el álgebra de segmentos es un anillo quizá no conmutativo” o bien, “El álgebra de segmentos basada en el teorema de Desargues es un anillo conmutativo”. Como ya lo hemos visto, estas investigaciones forman parte de los Grundlagen der Geometrie. Es más, el sentido del trabajo se puede invertir: en vez de ver qué clase de álgebra resulta a partir de un espacio, se pueden “construir” espacios a partir de las álgebras (v. gr., espacios afines a partir de anillos ternarios). Es evidente que nada de lo anterior habría sido posible si la matemática se hubiera mantenido dentro de los estrechos límites impuestos por el concepto de objeto matemático ofrecido por Kant. Esto lo sabía Hilbert, para quien la investigación axiomática representó un factor de expansión y descubrimiento en esta disciplina. Podemos decir entonces que para Hilbert la axiomática es algo más que un instrumento para ordenar las teorías. Más bien, se trata de un medio de investigación matemática. Esto se advierte claramente en los Grundlagen, donde “jugando” con los axiomas Hilbert obtiene numerosos resultados: geometrías no arquimedeanas, nuevos teoremas 68 1. E UCLIDES , K ANT, H ILBERT Y ... acerca de la continuidad, una nueva caracterización topológica del plano, una caracterización de la geometría euclidiana y de la geometría de Bolyai y Lobachevsky mediante grupos de desplazamientos, un análisis del papel de los teoremas de Desargues y de Pascal en la “coordenatización” del espacio, un estudio comparativo de las distintas geometrías entre sí, y una investigación de los medios requeridos para demostrar ciertos teoremas. En este sentido, las investigaciones de Hilbert en torno a los fundamentos de la geometría significaron un triunfo para el método axiomático, al punto de que en su opinión éste estaba llamado a ocupar un lugar preeminente no sólo en la matemática sino en la ciencia en general.98 1.7.1. Nociones ideales y dualidad El principio de dualidad de la geometría proyectiva guarda un estrecho vínculo con el llamado “método de los elementos ideales”. En su sentido original, este método consiste en introducir en una teoría elementos sin ninguna base intuitiva o constructiva. Su inclusión se justifica aduciendo que dicha acción es fructífera o tiene un efecto simplificador. En el caso que nos ocupa se trata de la incorporación de los puntos y la recta al infinito en el plano euclidiano, con lo que el espacio geométrico deviene en un espacio proyectivo. A continuación exponemos estas ideas con base en algunos conceptos pertenecientes a la teoría de conjuntos.99 Sea Π el conjunto de puntos del plano y Λ el correspondiente conjunto de rectas. Asociado a cada haz Φ de líneas paralelas de Λ, incorporamos un punto adicional P∞ , un “punto al infinito”. Ahora extendemos cada línea l ∈ Φ a una “línea” l como sigue: l = l ∪ P∞ Asimismo, introducimos una nueva “línea” l∞ , la “línea al infinito” de la siguiente manera: l∞ = {P∞ |Φ es un haz de líneas paralelas de Λ} Por último, extendemos el plano (afín) euclidiano a un plano proyectivo (Π , Λ ) como sigue: Π = Π ∪ {P∞ |Φ es un haz de líneas paralelas en Λ}; Λ = {l |l ∈ Λ} ∪ {l∞ } ¿Qué ventajas ofrece esta extensión del plano? Primero, que ya no hay excepciones: cualesquiera dos líneas se intersecan en al menos un punto; cuando éstas son euclidianamente paralelas entre sí, su intersección es el correspondiente punto al infinito 98 Véase 99 Véase al respecto (Hilbert, 1917). al respecto (Bennett, 1995, p. 43). 1.7. H ILBERT Y LA TEORÍA KANTIANA DE ESQUEMAS 69 P∞ . Segundo, que entre las nociones de punto y línea aparece la simetría ya señalada: el principio de dualidad es válido para esta nueva geometría, pues el plano se ha convertido con esta extensión en un espacio proyectivo. Las entidades recién introducidas son un claro ejemplo de lo que Hilbert denomina “elementos ideales”: por una parte, se trata de objetos que no corresponden a nada en la intuición espacial; por la otra, son objetos cuya incorporación aporta unidad y simplicidad a la teoría, pues evitan la existencia de casos especiales en los que ciertas propiedades no se cumplen. La adopción del método de los elementos ideales conllevaba, entre otras cosas, sobrepasar los límites del constructivismo kantiano, y eso fue lo que hizo Hilbert con todas sus implicaciones: abandonó la teoría de esquemas. A fin de cuentas, no sólo se trataba de la geometría, sino del análisis matemático y, sobre todo, de la teoría de los números transfinitos de Cantor. 1.7.2. Un ejemplo de la utilidad del método El uso de nociones ideales forma parte del desarrollo de las matemáticas. Hilbert ve en este método un factor de progreso al que no debemos renunciar, pues de su aplicación nuevas matemáticas resultan.100 Al respecto, podemos ilustrar la utilidad del método con un ejemplo. Se trata de la solución de un problema aritmético “simple” (es decir, relativo a números enteros) en el contexto de los números complejos. Consideremos la sucesión de números enteros 1, 1, 0, −2, −4, −4, 0, 8, 16, 16, 0, −32, −64, . . .; la cual se genera a partir de la base doble f (0) = 1, f (1) = 1 con la regla recursiva f (n + 2) = 2 f (n + 1) − 2 f (n).101 100 Entre los ejemplos que menciona se hallan los siguientes: √ 1. La introducción de la unidad imaginaria i = −1 que da lugar al teorema fundamental del álgebra: Toda polinomio de grado n con coeficientes reales tiene n raíces. 2. La adición de los puntos y la recta al infinito al plano euclidiano para completar un plano proyectivo. 3. La utilización plena de la lógica clásica en el análisis matemático y la teoría de conjuntos, donde el principio del tercero excluido se presenta como una noción ideal. Este principio sirve como base para las pruebas de existencia por reducción al absurdo que él mismo impulsa. 4. El axioma de elección en la teoría de conjuntos, con el caudal de resultados que se prueban con base en las posibilidades que nos ofrece. Otros ejemplos que podemos mencionar son la introducción de las cortaduras de Dedekind, la generalización cantoriana del concepto de número mediante la introducción de los números transfinitos, el lema de Zorn, la recursión transfinita y, más recientemente, las curvas fractales. 101 El ejemplo más famoso de esta clase de sucesiones recursivas es sin lugar a dudas la sucesión de Fibonacci: f (0) = 1, f (1) = 1 y f (n + 2) = f (n + 1) + f (n). 70 1. E UCLIDES , K ANT, H ILBERT Y ... Si bien la regla nos permite calcular cualquier elemento de la sucesión, tiene el inconveniente de que para computar f (n) es preciso calcular todos los valores anteriores.102 Se trata, claro está, de un procedimiento ineficiente, por lo que nos preguntamos si habrá una fórmula que nos permita calcular directamente el valor de f (n) (esta cuestión forma parte de la teoría de las funciones generatrices, la cual se estudia en los cursos de combinatoria.103 ) La respuesta a la interrogante anterior (en su forma general, es decir, con relación a cualquier sucesión recursiva) es afirmativa. No obstante, a la fecha no se conoce otra manera de hallar la fórmula que no sea adentrándose en el dominio del análisis complejo. En otras palabras: para resolver un problema relativo a números enteros, no conocemos otro camino que el de acudir a una extensión de la teoría mediante la adición de ciertas √ nociones ideales, como lo son los números irracionales y la unidad imaginaria i = −1. Y si bien aquí no es el lugar para abordar los detalles técnicos de la solución general, al menos podemos traer a colación la fórmula buscada. Se trata de la fórmula 1 1 f (n) = (1 + i)n + (1 − i)n 2 2 la cual se sirve explícitamente de los números complejos. Esto resulta sorprendente si consideramos que en un principio se trataba de una cuestión que sólo concernía a los números enteros. Y si bien la presencia de i se puede obviar en la fórmula anterior escribiendo (mediante ciertas transformaciones trigonométricas) f (n) = √ nπ 2n cos 4 queda el hecho de que para obtener esta última fórmula hemos tenido que realizar una digresión por el dominio de los números complejos (además de que en ella se alude a funciones trascendentes y al número π). Tenemos, por tanto, fuertes razones para justificar la extensión de los números enteros mediante la introducción de estos elementos ideales: la teoría gana en poder y generalidad. Desde la perspectiva de los números enteros, el carácter ideal de los números complejos es evidente: se generan mediante la introducción de una unidad imaginaria i totalmente ficticia ¿Tendrán algún tipo de existencia real tales objetos? Hilbert diría, con justa razón, que para hacer matemáticas no es necesario aclarar esta cuestión. Lo manifiesto es que tales números existen como un eficaz instrumento de la imaginación, y eso es todo lo que necesitamos saber. Su importancia radica en que con ellos la teoría aritmética se enriquece, pudiéndose resolver problemas que quizá de otra manera no podríamos solventar. Y es por esto que los admitimos. Aquí cabe recordar lo que algún día le dijera Hilbert a Brouwer tras una charla de este último en el Instituto de Matemáticas de Götingen: “Con sus métodos [constructivos], la mayor parte de los 102 Por ejemplo, para computar f (7) es necesario conocer los valores f (6) y f (5), lo cual exige a su vez conocer los valores f (4) y f (3), etc. 103 En (Graham, Knuth & Patashkin, 1989) hay una clara presentación de esta teoría. 1.7. H ILBERT Y LA TEORÍA KANTIANA DE ESQUEMAS 71 resultados de la matemática moderna tendrían que ser abandonados, y para mí la cosa más importante no es obtener menos resultados, sino más de ellos.” (Reid, 1970, p. 184). Fue a partir de consideraciones de este tipo que Hilbert formuló un criterio sui géneris de existencia matemática: en una teoría se puede admitir como existente todo aquello que no sea contradictorio con los supuestos básicos. Esto debilita la noción de existencia matemática, pues la reduce a la mera relatividad de la no contradicción, una cuestión lógica alejada del constructivismo kantiano. Esta noción se ajusta muy bien a la tendencia abstracta predominante en su momento. Al respecto, Hilbert establece los siguientes criterios como única condición de aceptación de nuevos elementos y nociones en una teoría: (a) que su anexión sea coherente con los contenidos de la teoría subyacente y (b) que aporten eficiencia y simplicidad en la producción del conocimiento matemático. Es con base en estos criterios que se les debe juzgar, no por la particularidad de satisfacer ciertas normas constructivas.104 Más tarde habría de añadir una condición de suma importancia: (c) que la adición de esta clase de nociones “ideales” a una teoría originalmente referida a entidades que podemos “realizar” (cristalizar) en el ámbito de la intuición (v. gr., la adición de nociones como la de número trascedente), no lleve a demostrar proposiciones relativas a dichas entidades que no sean intuitivamente verdaderas.105 1.7.3. Nuevos objetos, nuevas matemáticas ¿En qué sentido es el conjunto de los números naturales un objeto matemático? Ciertamente, no lo es en el sentido de Kant: lo que para este último caracteriza a los objetos matemáticos es la posibilidad de su construcción en la intuición pura, y ninguna totalidad infinita se puede producir de esta manera.106 Antes bien, el conjunto de los números naturales es sólo una idea, es decir, un concepto racional del que no puede haber en la experiencia objeto adecuado alguno. Y la matemática del siglo XIX cobijó 104 Fue hasta el siglo XX que Hilbert emprendió abiertamente la defensa del método de los elementos ideales. A ello corresponde el referido programa de los años veinte y la etapa aritmética de su formalismo, temas de los que nos ocuparemos posteriormente. No obstante, algunas ideas básicas ya las tenía en mente al escribir los Grundlagen der Geometrie, y se hallan presentes en su concepto del método axiomático. 105 Pensemos en lo contrario. Por ejemplo, que la aceptación del número π nos permite demostrar una proposición P acerca de los números naturales que no podemos reconocer como verdadera intuitivamente. En tal caso habría fuertes razones para rechazar la introducción de esta noción ideal, bajo el argumento que tiene consecuencias para los números enteros que no podemos validar sin ella. De esto hablaremos en extenso en las secciones 4.2.3 y 4.2.4 y 5.4.5. 106 Hagamos algunas precisiones con relación a la noción de objeto matemático en la epistemología de Kant. En su opinión todo objeto matemático ha de satisfacer dos condiciones: primero, ha de ser construible en el espacio y en el tiempo; segundo, se le ha de entender como una unidad, i. e., ha de haber un concepto que une sus partes en una totalidad. Es aquí donde entran en escena los esquemas: los conceptos sólo se pueden relacionar con los objetos a través de ellos (de los esquemas). Estos criterios están claramente establecidos en la Estética trascendental (v. gr., en A19/B33), en la Analítica trascendental (v. gr., en A137-47/B176-87) y en la Lógica trascendental (v. gr., en A92-3/B125). 72 1. E UCLIDES , K ANT, H ILBERT Y ... una multitud de entidades de esta naturaleza. Por ejemplo, el sistema de los números reales, los números transfinitos de Cantor, el conjunto (fractal) de Cantor, o curvas como la de Peano (que cubre un área rectangular) y la de Weierstrass, calificada por Hermite como “un mal deplorable”. Frente a la negativa de algunos matemáticos de aceptar entidades de esta naturaleza -v. gr., Kronecker y Poincaré-, Hilbert optó por extender conceptualmente esta ciencia y defender la libertad que tiene el matemático de elegir sus métodos y objetos de estudio. Como ya lo hemos visto, esto lo llevó a sobrepasar el constructivismo kantiano, hasta admitir como objetos ciertas ideas. En otras palabras, Hilbert extiende la noción de objeto matemático. Tal extensión vino emparejada con lo que podemos denominar cuasi-esquemas, es decir, procedimientos infinitos que se admiten como idealmente realizables.107 Nada de lo anterior carecía de sustento; más bien, era la expresión filosófica de una creciente tendencia generada en el interior de la matemática. Consideremos, por ejemplo, las cortaduras de Dedekind, cuya aparición en el siglo XIX significó la primera exposición formal del continuo numérico. Toda cortadura es un conjunto infinito de números racionales que representa a un número real. Estas entidades las podemos sumar y multiplicar, formando de esta manera un campo completo. Obviamente, en términos generales estas operaciones sólo tienen lugar en el pensamiento, sin la posibilidad de contar para cada una de ellas con un esquema que permita producir la nueva cortadura en su totalidad. Aún así, esta elaboración teórica es la base del análisis matemático moderno, una pieza central de ciertas teorías físicas que se hallan al centro del conocimiento de la naturaleza, algo a lo que Hilbert no estaba dispuesto a renunciar. Y frente al rechazo del sistema de los números reales en virtud del carácter no constructivo de sus elementos, Hilbert decidió extender el concepto de “objeto matemático” hasta admitir como tales ciertas ideas (elementos ideales en sus palabras). En conformidad, también decidió acoger y dar soporte a la generalización de la teoría kantiana de esquemas hasta incluir, como ya lo hemos señalado, procedimientos sólo realizables en un plano ideal, es decir, procedimiento que sólo tienen cabida en el pensamiento, nunca en la representación. Un claro ejemplo de lo anterior es la prueba que ofrece Cantor de que los puntos de un cuadrado se pueden poner en correspondencia uno a uno con los puntos de uno de sus lados. Quien siga la demostración verá que el procedimiento de intercalación de fracciones continuadas infinitas es tan sólo el apunte de una posibilidad, la generalización de un procedimiento realizable cuando el número de dígitos es finito. Y frente a la imposibilidad real de llevar a cabo el “encaje” propuesto, Cantor simplemente supone consumado el proceso e imagina el resultado: otra fracción continuada.108 Surgen con 107 Repitamos las palabras que Hilbert escribiera en un cuaderno de notas: “Cualquier cosa que es objeto del pensamiento es, por lo tanto, objeto de las matemáticas. Las matemáticas no son el arte de la computación, sino el arte de la no-computación.” La fecha de esta nota no se ha podido precisar, aunque es anterior a 1910 (Véase Hayashi, 2007, 2.2.3). Como complemento, véase también el apéndice T. 108 Quizá el caso más famoso de desdén al esquematismo kantiano lo constituye el axioma de elección, introducido por Zermelo hacia 1908. 1.7. H ILBERT Y LA TEORÍA KANTIANA DE ESQUEMAS 73 ello muchas dudas en torno a la existencia de estos objetos: ¿En qué sentido podemos decir que existen? La respuesta de Hilbert sería: en el sentido de algo que es pensado sin incurrir por ello en contradicciones.109 Obviamente, nada de lo que se “hace” en dominios como el de los números reales o la teoría cantoriana de conjuntos sería posible sin la correspondiente extensión del concepto de esquema a entidades no construibles. Sin adentrarnos por el momento en esta cuestión, debemos notar que hacia 1925 Hilbert concibió las nociones ideales como ideas regulativas en el sentido de Kant, y que fue con base en esta concepción que ideó su programa. Baste el comentario como un indicativo de que la epistemología de Hilbert se nutrió en todo momento con elementos tomados de la filosofía crítica de Kant. Y si bien en su concepción de la geometría adopta una perspectiva empirista, su visión general de las matemáticas se sustenta en muchas ideas tomadas de Kant. Esto es evidente en su segundo formalismo, donde preconiza el carácter a priori de una parte de la aritmética y se sirve de principios tomados de la Dialéctica Trascendental a fin de dar cabida a la moderna teoría del infinito.110 1.7.4. Comentarios finales En el prefacio del libro Anschauliche Geometrie,111 escrito en colaboración con S. Cohn-Vossen en 1921, Hilbert advierte: En las matemáticas, como en cualquier otra disciplina científica, se hallan presentes dos tendencias. Por una parte, la tendencia hacia la abstracción, que busca cristalizar las relaciones lógicas inherentes al caudal de resultados estudiados tratando de unificar el material de manera sistemática y ordenada. Por la otra parte, la tendencia a la comprensión intuitiva, que nos alienta a significar de manera inmediata tales relaciones lógicas, subrayando su significado concreto. En la geometría, la tendencia abstracta ha conducido a las magníficas teorías de la geometría algebraica, la geometría de Riemann y la topología; estas teorías se sirven ampliamente del razonamiento abstracto y del cálculo simbólico en el sentido del álgebra. No obstante, hoy en día sigue siendo tan cierto como siempre que la comprensión intuitiva desempeña un papel principal en este dominio. Tal intuición concreta es de gran valor no sólo para el investigador, sino para todo aquel que desee estudiar y apreciar los resultados de la geometría. (Hilbert, 1952, p. iii) 109 Aquí reaparece, en toda su extensión, la idea de fundamento en el segundo sentido ampliamente comentado en la sección 1.5.1: La consistencia como sostén de una teoría. 110 Este tema será tratado en el capítulo 4, en el contexto del formalismo desarrollado por Hilbert en la década 1920-1930, en íntima conexión con el finitismo y el llamado Programa de Hilbert. 111 (Hilbert y Cohn-Vossen, 1952) es una traducción de este libro al inglés. 74 1. E UCLIDES , K ANT, H ILBERT Y ... Las palabras anteriores muestran un aspecto muy poco conocido del pensamiento de Hilbert. Para él, la formalización no es un objetivo final, sino una fase en el movimiento propio del pensamiento matemático. Desde su punto de vista, la matemática se desenvuelve en medio de una dialéctica entre lo formal y lo intuitivo, entre la forma y el contenido. El libro de cuyo prefacio hemos tomado el pasaje anterior es en sí una viva expresión de esta duplicidad, donde el lector podrá descubrir diversos aspectos visuales de la geometría proyectiva y diferencial, de la cinemática y la topología. Y si bien nosotros nos hemos concentrado casi en exclusiva en las ideas que tiene Hilbert acerca de las matemáticas puras, sería un error desestimar la perspectiva anterior. Hilbert no es el formalista radical que muchos autores presentan; más bien, como ya lo hemos visto, él ve en la axiomática un instrumento para: i) elaborar un montaje conceptual con relación a una teoría, ii) generalizar las teorías y iii) investigar las teorías mismas y establecer vínculos entre distintas áreas de las matemáticas. Al respecto, esperamos haber proyectado suficiente luz sobre su pensamiento como para desmentir la falsa creencia de que se trata de un purista matemático para quien la matemática no es más que un juego formal con vacuos conceptos. Por el contrario, la imagen que le corresponde es la de un pensador para quien las matemáticas obedecen a múltiples intereses, uno de los cuales es el de ser un instrumento esencial para el conocimiento de la naturaleza. En cuanto a Kant, esperamos haber contribuido a esclarecer su teoría del conocimiento geométrico al mirarla bajo la luz de la teoría de esquemas. De hecho, la consideración del esquematismo kantiano nos ha permitido: (i) entender con mayor claridad la epistemología hilbertiana, aunque hasta ahora sólo hayamos presentado un esbozo parcial de la misma; (ii) examinar el pensamiento de Kant desde un ángulo que aclara la noción que sustenta de los objetos matemáticos; (iii) iluminar los cambios ocurridos en la matemática durante el siglo XIX; (iv) entender cómo se relacionan los conceptos y los objetos en la geometría clásica, y (v) aclarar la noción de objeto matemático que introduce Hilbert en la filosofía de las matemáticas. Al respecto, sólo hemos considerado el esquematismo kantiano desde la perspectiva de la geometría, sin tocar en absoluto su relación con la aritmética. Esto es así en virtud de que las primeras manifestaciones del formalismo de Hilbert se dieron en torno a los fundamentos de la geometría, tema central de este capítulo. De igual forma, no hemos considerado en plenitud la explicación que da Hilbert del conocimiento matemático en general, pues esta tarea la acomete justo en la segunda etapa de su formalismo, un tema que veremos más adelante. No obstante, con los elementos ofrecidos esperamos haber puesto en claro que el formalismo de Hilbert, antes que una negación de la epistemología de Kant, constituye una generalización necesaria de la misma en adecuación a la matemática de su tiempo. 1.8. L A CONSISTENCIA DE LA GEOMETRÍA 1.8. La consistencia de la geometría 1.8.1. La relación entre las nuevas geometrías y la euclidiana 75 Hoy en día es difícil valorar la importancia del descubrimiento de las geometrías no euclidianas. En su momento éstas fueron aclamadas como preeminentes en la emancipación del intelecto humano y el más notable y sugestivo logro del siglo diecinueve. Su efecto fue devastador: su sola presencia hizo posible el rechazo de la vieja creencia de que la geometría euclidiana era inherente a la naturaleza y sus proposiciones verdades necesarias. Por el contrario, los axiomas comenzaron a verse como hipótesis cuyo carácter descriptivo de algún tipo de estructura (por ejemplo, la del espacio físico) habría que comprobar, lo cual ya no concernía a la matemática misma. Esta clase de consideraciones se halla en la base de la tesis de Hilbert según la cual una teoría abstracta no es sino un entramado de relaciones que no necesita para su edificación sino de su consistencia interna.112 Hubo entonces que considerar las distintas geometrías a la luz de esta noción. Aunque Lobachevski, Bolyai y Riemann no encontraron contradicciones al explorar las nuevas geometrías, nada garantizaba este hecho. ¿Cabía la posibilidad de que en ellas se pudieran deducir cosas contradictorias? Esta era una pregunta novedosa, pues hasta entonces nadie se había planteado esta cuestión con relación a la geometría euclidiana. ¿Cómo probar su coherencia interna? Sobre la base del desarrollo de cada teoría no se podía dar una respuesta definitiva: el hecho de que no se hubiera encontrado ninguna contradicción no garantizaba nada, se trataba a lo más de una evidencia empírica ¿Había alguna manera de decidir la cuestión? En 1868 Eugenio Beltrami (1835-1899) publicó un artículo en el que respondió parcialmente al problema de la consistencia de la geometría de Lobachevski: demostró que ésta se puede interpretar como la geometría sobre cierta clase de superficies en el espacio euclidiano tridimensional.113 Con ello dejó ver que cualquier inconsistencia en dicha geometría se traduciría en una inconsistencia en la geometría euclidiana. Resulta así que la primera es consistente en caso de que la segunda lo sea. Tiempo después Poincaré descubrió algo similar: la geometría que resulta de suponer que por un punto fuera de una línea recta es posible trazar más de una paralela, se puede interpretar como la geometría de ciertos puntos y semicírculos en el plano euclidiano (el modelo ya fue expuesto en la sección I.7). El resultado es el mismo: toda contradicción en esta geometría no euclidiana se transformaría en una contradicción en la euclidiana (lo que resultaría en la imposibilidad de esta última). En cuanto a la geometría de Riemann, 112 En la misma época el álgebra se liberó del concepto de cantidad, abriendo las puertas a la consideración de una multitud de operaciones que dependían más que nada de su representación simbólica. 113 Es decir, que tales superficies son un modelo de la geometría de Lobachevski, donde por modelo se entiende una interpretación que hace verdaderos a los axiomas. 76 1. E UCLIDES , K ANT, H ILBERT Y ... ésta también se puede interpretar como la geometría de la superficie de una esfera euclidiana definiendo adecuadamente los conceptos de punto y línea recta.114 La existencia de modelos euclidianos de las nuevas geometrías no constituyó una prueba categórica de que éstas son consistentes, sino sólo de que lo son en la medida en que la euclidiana lo sea. En efecto, si, por ejemplo, la geometría de Riemann fuera inconsistente, esto permitiría demostrar en ella dos proposiciones –una la negación de la otra– que serían verdaderas acerca de la esfera euclidiana que sirve como modelo de tal geometría. Por lo tanto, la geometría euclidiana también sería inconsistente, pues de los postulados que sirven como base para la construcción de la esfera se deducirían contradicciones. Se concluye que si la geometría de Riemann es inconsistente, la euclidiana también lo es o, recíprocamente, que si la geometría euclidiana es consistente, la geometría de Riemann también lo es. Esta cuestión, que para él tenía una importancia primordial, la convirtió Hilbert en un tema de investigación en torno a los fundamentos de la geometría. Al respecto, la respuesta que halló fue parcial, pues lo único que logró fue remitir el problema de la consistencia de la geometría al de la consistencia del sistema de los números reales. Como veremos, para atacar este último problema hubo de idear un método sumamente original que marcó su trabajo en el terreno de la lógica entre 1903 y 1930, un método cuya dificultad correspondió a Gödel aclarar. Como ya lo hemos señalado, para Hilbert la consistencia es la única condición exigible a una teoría para admitirla en el terreno de la matemática pura, sin la necesidad de explicar su origen o propósito. Dicho de otra manera, la consistencia interna en el único fundamento de cada teoría.115 Fue entonces que la matemática dejó de ser considerada la ciencia de la cantidad y la extensión de los antiguos, para convertirse en la ciencia de lo posible, donde por “posible” se entiende aquello que no conduce a contradicción. En cuanto a la consistencia, ésta es una propiedad lógica, no ontológica, y al adoptarla como único criterio de validez de las teorías Hilbert las liberó de la obligación de ser descriptivas del “mundo externo”.116 Esta idea de ya no “referirse al mundo externo” se hizo presente incluso al investigar la consistencia de las geometrías no euclidianas, pues todos los modelos que de ellas se dieron fueron obtenidos como parte de la geometría euclidiana. Como a continuación veremos, lo mismo ocurrió al investigar la consistencia de la geometría euclidiana, de la que lo único que se pudo ofrecer fue un modelo algebraico. 114 En el apéndice B el lector hallará una exposición más o menos detallada de sendos modelos euclidianos para las geometrías de Lobachevski y de Riemann. 115 Nótese que esta condición no exige que se exhiba un sistema de objetos acerca del cual la teoría es verdadera. Al respecto, en 1930 Gödel probó lo siguiente: Una teoría de primer orden es consistente si y sólo si tiene un modelo. 116 La consistencia, repetimos, es una propiedad formal, que no depende del significado que se les dé a los conceptos básicos, y puede por lo mismo ser investigada sin recurrir a nada externo al sistema axiomático. Esta posibilidad será la base del llamado Programa de Hilbert que habremos de considerar más adelante. 1.8. L A CONSISTENCIA DE LA GEOMETRÍA 1.8.2. 77 La consistencia de la geometría euclidiana plana Como sabemos, un modelo de una teoría axiomática es una realización de la misma en algún dominio (preferentemente matemático) que ya se tiene a la mano. En el caso específico de la geometría euclidiana plana, para construir el modelo Hilbert identificó los “puntos” y las “líneas” con ciertos objetos construidos a partir del sistema de los números reales y demostró que bajo dicha identificación de los términos primitivos, los axiomas de la teoría se convierten en proposiciones verdaderas. Esto ilustra a la perfección dos cosas: primero, la idea de que un modelo es un sistema matemático bien definido, el cual tiene la estructura caracterizada por los axiomas; segundo, la negativa de los matemáticos a abandonar el dominio de la matemática misma para dar significado a sus teorías. En cuanto al modelo para los axiomas de la geometría, el procedimiento que exponemos es muy cercano al de Hilbert en los Grundlagen, y tiene como base el método de las coordenadas. Lo primero es indicar qué significan los términos primitivos, y mostrar después que bajo tal glosa los axiomas de la geometría se convierten en teoremas de la teoría donde se les interpreta. Para ello hacemos las siguientes identificaciones: 1. Por “punto” entendemos pareja ordenada (x, y) de números reales. A los números x e y se les llama coordenadas del punto. 2. Sean a, b y c tres números reales tales que a y b no son ambos cero. Por “línea” entendemos el conjunto solución de la ecuación ax + by + c = 0, es decir, el conjunto de parejas ordenadas (puntos) {(x, y)|x ∈ R, y ∈ R, ax + by + c = 0} En este contexto, dos ecuaciones de primer grado en x e y cuyos coeficientes difieren de una expresión a la otra en un factor constante distinto de cero, representan una y la misma línea, y cualquiera de ellas se llamará ecuación de la línea. 3. Decimos que un punto “incide con” o “está en” una línea si y sólo si las coordenadas del punto satisfacen la ecuación de la línea.117 4. Decimos que el punto (x, y) “está entre” los puntos (a, b) y (a , b ) si y sólo si hay un número real t, mayor que 0 y menor que 1, tal que x = a + t(a − a) e y = b + t(b − b). 5. Decimos que el par de puntos p(x1 , y1 ), q(x2 , y2 ) es “congruente” con el par de puntos r(x3 , y3 ), s(x4 , y4 ) si y sólo si (x2 − x1 )2 + (y2 − y1 )2 = (x4 − x3 )2 + (y4 − y3 )2 . 117 Nótese que la relación “incidir con” es una relación binaria entre puntos y líneas. Esta distinción es relevante en la medida en que pone de manifiesto la idea de que los axiomas se inscriben en el contexto de una teoría general de relaciones. 78 1. E UCLIDES , K ANT, H ILBERT Y ... 6. Sean A(x1 , y1 ), B(x2 , y2 ), C(x3 , y3 ), A (x1 , y1 ), B (x2 , y2 ) y C (x3 , y3 ) seis puntos tales que B, C son distintos de A, y B , C son distintos de A . Decimos que los ángulos BAC y B A C son congruentes si y sólo si (x2 − x1 )(x3 − x1 ) + (y2 − y1 )(y3 − y1 ) = (x2 − x1 )2 + (y2 − y1 )2 (x3 − x1 )2 + (y3 − y1 )2 (x2 − x1 )(x3 − x1 ) + (y2 − y1 )(y3 − y1 ) (x2 − x1 )2 + (y2 − y1 )2 (x3 − x1 )2 + (y3 − y1 )2 Las ideas geométricas subyacentes a estas definiciones se exponen con todo cuidado en el apéndice D, en el que además se bosqueja la demostración de que los axiomas de Hilbert corresponden a enunciados aritméticos verdaderos bajo esta lectura, y por lo tanto que la aritmética de los números reales suministra el modelo buscado. Cabe señalar que la interpretación de los puntos como parejas ordenadas de números reales es posible gracias al axioma V.2, que asegura que en toda línea habrá suficientes puntos como para que ésta constituya un continuo y se puedan poner en correspondencia uno a uno con los números reales.118 Al respecto, la cuestión de la continuidad es fundamental para el cálculo diferencial e integral y el análisis matemático, y al parecer Hilbert introduce el axioma V.2 con el propósito de vincular al álgebra con la geometría y aplicar el cálculo en la resolución de problemas. No obstante, y como ya lo hemos señalado, para deducir los teoremas de la geometría elemental el axioma V.2 no es necesario y la construcción de un modelo para los primeros catorce axiomas no requiere de la totalidad de los números reales, sino de los números algebraicos o una fracción de éstos. Fue así que en los Grundlagen Hilbert consideró para estos catorce axiomas no el modelo que acabamos de ver, sino uno más reducido, tomando como base un campo numérico más limitado.119 La causa por la cual pensó que valía la pena ofrecer una demostración por separado del menos comprehensivo teorema de consistencia fue que la aritmética a la que se relativizaba la consistencia de la geometría era más simple desde el punto de vista matemático, y por lo mismo menos dudosa o abierta a la duda filosófica que la prueba general.120 Una vez demostrada la consistencia de los axiomas, Hilbert procedió a demostrar que éstos eran, en todos los sentidos relevantes, independientes entre sí. Eso lo hizo, como dijera Hermann Weyl, “mediante algunas geometrías peculiares, construidas ad hoc”, en las que todos los axiomas se cumplen excepto aquel cuya independencia 118 Para un análisis más detallado de la relación entre el postulado de completud (básicamente, el postulado de Dedekind) y la recta numérica, consúltese Bartle, 1964, pp. 45-51. 119 La base del modelo nos es conocida: se trata de todos los números algebraicos que integran al conjunto Ω de la sección 1.6.4. 120 La prueba de consistencia relativa no establece nada acerca de los objetos geométricos (nada dice de los puntos y las líneas, ni prueba nuevos teoremas), sino que informa acerca de las propiedades lógicas de la teoría. En otras palabras: al investigar las propiedades lógicas de la teoría se puede recurrir a nociones semánticas, pero no al derivar teoremas. 1.8. L A CONSISTENCIA DE LA GEOMETRÍA 79 se demuestra, del que se cumple la negación, tal como lo hicimos con el axioma de Arquímedes en la sección I.6.4. En suma: lo que Hilbert hizo para la geometría euclidiana fue construir un modelo dentro de la aritmética de los números algebraicos. Argumentó entonces que si una contradicción fuese deducible de los axiomas para la geometría, también se podría deducir una contradicción en la aritmética, de donde se sigue que, una vez garantizada la consistencia de esta última, la consistencia de la geometría euclidiana quedaría asegurada (consistencia relativa). Este resultado le permitió ver que la aritmética de los números algebraicos es más comprehensiva y fundamental que la geometría, al menos desde el punto de vista de la lógica. Se suscitó así el problema de probar la consistencia de la aritmética, pero bajo circunstancias distintas: por una parte, ya no había una teoría más confiable a la cual se le pudiera reducir, y por la otra, aunque la hubiera (la recién nacida teoría de los conjuntos podría ser un buen candidato), poco o nada se ganaría con ello: la solución final del problema de la consistencia no se lograría por este camino, pues siempre habría una teoría en espera de que su consistencia fuera probada. Se tendría, por ejemplo, una cadena del siguiente tipo: la geometría de Lobachevski es consistente si la geometría euclidiana lo es; la geometría euclidiana es consistente si la aritmética de los números reales lo es; la aritmética de los números reales es consistente si la teoría de los conjuntos lo es, etc. lo cual no constituiría una solución definitiva al problema de la consistencia de estas teorías. Este estado de cosas llevó a Hilbert a considerar el problema de la consistencia de la aritmética como un importante reto al que había que hacer frente. Fue así que en el segundo Congreso Internacional de Matemáticas celebrado en París en el verano de 1900, al presentar una lista con los problemas más relevantes que, en su opinión, habría de encarar la matemática en el siglo veinte, citó en segundo lugar el referente a la consistencia de la aritmética, el cual enunció escuetamente como sigue: Investigar la consistencia de los axiomas de la aritmética 121 La sencillez del enunciado contrasta con las enormes dificultades que habría que superar para lograr la prueba anhelada, que no sólo sería salvaguarda de la aritmética, sino de las distintas geometrías por igual. En aquel momento Hilbert no pudo imaginar que jamás se contaría con tal garantía bajo ciertas condiciones: en manos de Gödel, la investigación de este problema hubo de mostrar su verdadero grado de dificultad, y desde entonces no se tiene idea de en qué dirección se podría encontrar una respuesta satisfactoria. Es más, somos de la opinión de que jamás se tendrá tal garantía, si por “garantía” se entiende “certeza racional”.122 121 La selección de los problemas tuvo como base el impulso que, creía, éstos darían a nuevos avances y desarrollos en la matemática. La lista contenía un total de veintitrés problemas y Hilbert no la consideró exhaustiva, sino significativa. Este hecho, el que un matemático de renombre se presentase ante el pleno de su comunidad a decirles a sus colegas por qué derroteros habría de marchar la ciencia en el siguiente siglo, fue algo inusitado y, creemos, irrepetible, una muestra del lugar que Hilbert ocupó en su tiempo. 122 Desde nuestro punto de vista, la investigación axiomática de la aritmética también forma parte del 80 1. E UCLIDES , K ANT, H ILBERT Y ... 1.9. Cuestiones complementarias 1.9.1. La naturaleza de la geometría: El punto de vista de Kant Podemos ahora contrastar los puntos de vista de Hilbert y de Kant con relación a la naturaleza de la geometría. De algún modo se trata de la disimilitud entre los puntos de vista clásico y moderno en torno a la matemática. Esta labor exige considerar algunas ideas de la epistemología de Kant que apenas si fueron mencionadas en las secciones 1.3.2 y 1.4, pues es con base en ellas que este filósofo pretende justificar la validez del conocimiento matemático. Estas ideas tuvieron una gran influencia en los debates filosóficos en torno a la matemática durante el siglo diecinueve y parte del veinte. Al respecto podemos decir que Kant fue el filósofo que más atención recibió en los debates suscitados en torno a los fundamentos de las matemáticas durante el periodo que nos ocupa, incluso por parte de Hilbert. Comencemos con una observación: Kant escribió la Crítica de la razón pura en 1781, una época en la que los cambios que vendrían en la matemática durante el siglo diecinueve no se preveían de ninguna manera. En aquel tiempo la validez universal del sistema euclidiano era comúnmente aceptada. La importancia de lo anterior se magnifica al notar que dicho sistema era un pilar de la mecánica de Newton, en la que el espacio se consideraba como un concepto absoluto (es decir, no deducible ni definible mediante ningún proceso físico). Kant vio en ello un problema filosófico: ¿De dónde provenía la certeza de las proposiciones aritméticas y geométricas? ¿Por qué la matemática mostraba tal solidez en sus juicios? ¿A qué se debía la necesidad y la universalidad de sus proposiciones? En su momento nadie dudaba de que la suma de los ángulos internos de un triángulo fuera igual a dos rectos (¿qué otra cosa podría ser?), ni que las leyes del álgebra tuvieran validez absoluta ¿Por qué las cosas tenían que ser así? En la Crítica de la razón pura Kant procura una respuesta a estas interrogantes. Para ello comienza distinguiendo entre proposiciones analíticas y proposiciones sintéticas, y entre el conocimiento a priori (el que es independiente de la experiencia) y el conocimiento a posteriori (el que depende de la experiencia).123 Con base en tales análisis lógico de nuestra intuición, en este caso la relativa a los números. Esta última afirmación significa, entre otras cosas, que estamos convencidos de que ningún análisis de esta naturaleza puede producir un cuadro completo, una imagen perfecta y acabada, de los contenidos de nuestra intuición, ni asegurar que lo que resulte de él será un “discurso” coherente. En otras palabras, somos de la opinión de que la razón matemática no es autovalidativa. 123 Es importante señalar que en este y otros apartados mantendremos la terminología utilizada por Kant, en la que utiliza el término “juicio” donde nosotros podríamos utilizar el término “proposición”. Al respecto, por “juicio” se suelen entender dos cosas. Por una parte, el acto de juzgar, es decir, de decidir en torno a cosas que pueden ser de una u otra manera (un acto mental); por la otra, al resultado de dicho acto, que suele expresarse mediante el enunciado o la proposición. Así, en un sentido estricto la proposición se debe entender como un producto lógico del acto de juzgar, si bien a veces se le refiere como un juicio (como lo hace Kant). Lo anterior concuerda con el uso de estos términos en la filosofía moderna, donde 1.9. C UESTIONES COMPLEMENTARIAS 81 distinciones plantea el problema anterior de la siguiente manera: ¿Cómo son posibles los juicios sintéticos a priori, particularmente los de la matemática?, ¿cómo algo puede ser evidente por sí mismo? Cabe señalar que Kant no pretende probar la existencia de tales juicios, pues en su opinión los de la física y la matemática son claros ejemplos de ello; más bien, lo que busca es explicar cómo es que son posibles.124 En los Prolegómenos, una obra escrita en 1783 con la intención de exponer los puntos de vista esenciales de su filosofía crítica, Kant expresa la idea de que los juicios de la matemática son sintéticos a priori con las siguientes palabras: Ante todo, debe notarse que las proposiciones de las matemáticas propiamente dichas son siempre juicios a priori y no empíricos, porque traen consigo necesidad, lo cual no puede ser tomado de la experiencia.125 A lo que más adelante añade (tocando un aspecto ya mencionado en el apartado I.3): Lo esencial y característico del puro conocimiento matemático con respecto a todos los otros conocimientos a priori, es que, en absoluto, no debe proceder de los conceptos, sino siempre mediante la construcción de estos. Pues dado que, en sus proposiciones, ésta debe pasar sobre la noción hasta lo que contiene la intuición correspondiente a ella, no pueden ni deben jamás sus proposiciones brotar de la descomposición del concepto, esto es, nacer analíticamente, y de ahí que sean todas sintéticas.126 La manera en que Kant establece la posibilidad de los juicios sintéticos a priori es sumamente ingeniosa, aunque en la actualidad la solución que ofrece ya no es aceptada. En lo que sigue presentamos algunas de sus ideas con relación al conocimiento geométrico. Al respecto, el lector podrá recurrir directamente a la Crítica de la razón pura, secciones B37-B73 o a los Prolegómenos, parágrafos §6 - §13 y §49. se considera al juicio como el acto u operación de la mente que se expresa en la proposición, remarcando con ello el carácter lógico del acto de juzgar. 124 Si el lector no conoce la clasificación que Kant hace de los juicios, a los que divide en tres clases según sean sintéticos a priori, sintéticos a posteriori o analíticos (que siempre son a priori), le recomendamos que acuda a la fuente original –(Kant, 1783 y 1787)– o bien a la extensa literatura sobre el tema, en la que un texto recomendable es (Körner, 1960). Por el momento en un adendo al final de este capítulo, es decir, después de la subsección 1.9.5, comentamos brevemente este tema. 125 Kant, Prolegómenos, p. 59. 126 Ibid p. 61. Muchas de estas cuestiones ya fueron tocadas en la sección I.3, sobre todo con relación a la proposición I.32 de los Elementos de Euclides ¿Cómo es que sabemos tal cosa, es decir, cómo es que sabemos que los ángulos internos de un triángulo son igual a dos ángulos rectos? ¿Por observación? No, pues la afirmación es relativa a todos los triángulos, de los que hay una infinitud. La respuesta es que lo sabemos por demostración, sin ningún tipo de experimentos. No obstante, la proposición es sintética, pues la noción de “ser igual a dos rectos” no está contenida en la nociones de “triángulo”, “ángulo interior”, etc. como ya lo hemos señalado. Más bien, esto resulta de la consideración del diagrama (la intuición correspondiente a los conceptos comprendidos, como señala Kant), de la que resulta evidente. Debido a esto, diría Kant, es que el juicio expresado en esta proposición es sintético y a priori. Esto hace ver, además, que el uso del diagrama en la demostración es esencial, pues Euclides lo necesita para extraer de él conclusiones que no podría obtener sobre la sola base de los conceptos y los postulados. La aprioricidad radica en que el objeto examinado no es empírico, sino el resultado de una construcción en la intuición pura (es decir, la intuición sin ningún elemento empírico). 82 1. E UCLIDES , K ANT, H ILBERT Y ... Kant sostiene que el único modo que tenemos los humanos de contactar con el mundo externo es a través de los sentidos. Percibimos los objetos del mundo físico bajo la forma de impresiones acústicas, ópticas, táctiles, etc., provenientes de estos. No obstante, lo que los sentidos nos proveen es apenas la substancia de nuestras percepciones. Para poder aplicar a estos datos sensoriales los conceptos e ideas que constituyen los elementos de nuestra actividad intelectual debemos darles una cierta forma: Los debemos situar en el espacio y, tal vez, en el tiempo. Somos nosotros quienes colocamos la substancia de nuestras percepciones bajo estas formas. Precisemos lo anterior con relación a la geometría. Kant distingue dos aspectos presentes en toda percepción de los objetos externos. Por una parte, el material empírico (bajo la forma de datos sensoriales); por la otra, el espacio en que dicho material se localiza. Al respecto sostiene dos cosas: 1) que la percepción externa es imposible a menos que lo percibido se ubique en el espacio y, 2) que los cambios en el material empírico no afectan la estructura del espacio en que dicho material se ubica, es decir, que el elemento espacial no forma parte del material empírico. Conforme a este punto de vista el espacio y el tiempo no son cosas que se perciben a través de los sentidos, no son datos suministrados por éstos; más bien, son formas bajo las que percibimos las cosas. Dicho de otra manera: espacio y tiempo no son rasgos o aspectos de las cosas que éstas poseen con independencia de nuestro conocimiento de ellas; más bien, son condiciones subjetivas que residen en el sujeto cognoscente a fin de estructurar sus experiencias. “El espacio, dice Kant, no es otra cosa que una forma de mi sensibilidad.” (Prolegómenos §49).127 A esto se le conoce como idealismo trascendental. Por ejemplo, en un juicio perceptual acerca del mundo físico como “la mesa está entre las sillas”, los datos empíricos son la mesa, las sillas y una relación espacial entre tales objetos. Nótese que el juicio no es relativo al espacio, sino a la relación de posición que guardan entre sí la mesa y las sillas. Al respecto, Kant sostiene que no es posible percibir dichos objetos sino como estando en el espacio (todos los objetos externos son intuidos de esa manera) y sin que aparezcan guardando entre sí una cierta relación de posición. Kant diría que al percibir la mesa y las sillas, el espacio aparece juntamente con ellas, como una especie de “contendor” que nos permite observarlas. Nuestros sentidos externos (la vista, el oído, el tacto, etc.) siempre lo incluyen como el lugar en el que se hallan los objetos, sin que forme parte de los mismos (es decir, sin que sea parte de lo percibido). Esa es la forma de nuestra percepción externa; se trata, como ya lo hemos dicho, de una condición de posibilidad de toda percepción externa, sin la cual ningún juicio del tipo considerado sería posible. Al mismo tiempo Kant rechaza la tesis Newtoniana según la cual el espacio es absoluto, i. e., algo que es permanente y existe independientemente de la materia o de quien percibe los objetos externos. Más bien, lo considera una condición a priori existente sólo en la mente humana como medio para dar forma (estructura) a nuestras experiencias. 127 Kant diría que las experiencias físicas nada tienen que ver con el tiempo y el espacio. Es función de nuestro intelecto proveer estas formas para organizar los datos sensibles y poderlos utilizar en relaciones espaciales y temporales. 1.9. C UESTIONES COMPLEMENTARIAS 83 En la Crítica de la razón pura Kant expresa lo anterior con las siguientes palabras: El espacio es una necesaria representación a priori que sirve de base a todas las intuiciones externas. Jamás podemos representarnos la falta de espacio, aunque sí podemos muy bien pensar que no hay objetos en él. El espacio es, pues, considerado como condición de posibilidad de los fenómenos, no como una determinación dependiente de ellos, y es una representación a priori en la que se basan necesariamente los fenómenos externos. (CRP, B39). Éste es el lado idealista de la filosofía de Kant: el espacio sólo existe en la mente humana, no fuera de ella, y es lo que nos permite estructurar nuestras experiencias externas, es decir, es la forma a priori de la sensibilidad externa. La parte polémica de la epistemología de Kant es la tesis de que esta forma no tiene un origen empírico, es decir, no se extrae de la experiencia sensible, sino que es su condición de posibilidad. Se trata, por tanto, de una intuición pura: “intuición” porque permite la intuición empírica (es el marco en el que se ha de dar dicha intuición) y “pura” porque no tienen un origen empírico. ¿Y la geometría? Según Kant la geometría es la ciencia que establece las propiedades del espacio sintéticamente y, no obstante, a priori. Lo hace siguiendo dos caminos: mediante construcciones en la intuición pura y por demostración. Esto es así porque el espacio posee una estructura que podemos descubrir y caracterizar sin acudir a la experiencia, mediante el examen de la intuición que se halla en nosotros a priori, con anterioridad a toda percepción de los objetos. Si se acepta esta idea entonces se vuelve claro por qué los principios de la geometría no necesitan de la observación. Más bien, nuestras observaciones son consecuencia directa de nuestra intuición espacial. Es la mente, al mirar hacia su interior, la que descubre los postulados básicos de la geometría. Esta postura de Kant significó un hito en la historia de la filosofía y tuvo enormes consecuencias en la filosofía de las matemáticas. Por ejemplo, W. R. Hamilton (18051865), tras estudiar a Kant, concluyó que si la geometría refleja al espacio, entonces el álgebra debería reflejar al tiempo, y escribió un tratado con el nombre El álgebra como la ciencia del tiempo puro en el que se sirve de la unidimensionalidad del tiempo para asociarlo con nuestro sistema numérico, que es una variedad unidimensional. El desarrollo de la matemática en el siglo diecinueve puso en tela de juicio la solución propuesta por Kant. En particular, la aparición de las geometrías no euclidianas puso en claro que los postulados de Euclides no son el único fundamento sobre el que se puede erigir la geometría. Surgieron así sistemas de geometría en los que las propiedades del espacio son muy distintas a lo previsto por la geometría euclidiana. Pero si otros sistemas rivales son posibles, entonces no se puede tomar una decisión sobre cuál es la estructura del espacio en su forma pura (es decir, la forma bajo la cual observamos los fenómenos) sobre criterios puramente lógicos. En tal caso dejaría de ser cierto que la mente dicta las leyes del espacio y todo el concepto de un espacio único dejaría de ser válido, al igual que el apriorismo kantiano. 84 1. E UCLIDES , K ANT, H ILBERT Y ... 1.9.2. El apriorismo en la matemática después de Kant En el siglo diecinueve muchos matemáticos expresaron sus dudas respecto a la validez del punto de vista de Kant acerca de la naturaleza a priori de las matemáticas. Por ejemplo, en 1817 Gauss, en una carta dirigida a Olbers, expresa abiertamente su recelo respecto del carácter necesario de la geometría con las siguientes palabras: Cada vez me convenzo más de que la necesidad de nuestra geometría no se puede probar, al menos no por la comprensión humana ni para la comprensión humana [Gauss se refiere a los intentos por probar el quinto postulado de Euclides]. Quizá en otra vida alcanzaremos otros puntos de vista acerca de la naturaleza del espacio que por ahora no nos son asequibles. Hasta entonces, no se deberá poner a la geometría en el mismo rango que la aritmética, que se yergue a priori, sino en la misma situación que, digamos, la mecánica.128 Así, donde Kant establece una similitud epistemológica entre la geometría y la aritmética, Gauss advierte una asimetría. Tiempo después, la llegada de las geometrías no euclidianas y las pruebas de su mutua posibilidad alimentaron esta sospecha: la aritmética y la geometría parecían no compartir una misma jerarquía epistemológica. Esta cuestión se convirtió en un tema central de la filosofía de las matemáticas y orientó en gran medida el estudio de sus fundamentos. Dilucidarla se convirtió en uno de los ejes de las investigaciones de muchos filósofos y matemáticos, incluyendo a Bolzano, Dedekind, Hamilton, Helmholtz, Frege, Poincaré y Hilbert y, posteriormente, a Russell, Bernays, Brouwer y Weyl, entre otros. A grandes rasgos, hubo tres maneras de solventar el problema, según el modo de disponer del a priori. Por ejemplo, Poincaré, en conformidad con Gauss, opta por retener la concepción kantiana de la aritmética, adoptando a la vez una concepción no kantiana de la geometría (es decir, viendo en ella algo cuya fuente no es una forma a priori de la intuición). La de Frege fue la contraria: retuvo la concepción kantiana de la geometría (como algo basado en una intuición a priori), y desechó la concepción kantiana de la aritmética. La de Hilbert fue un poco más compleja: mantuvo cierto apriorismo en ambos casos, aunque en forma limitada (i. e., a cambio de restringirlo). Más adelante habremos de referirnos a estas cuestiones con relación a varios de estos autores. Este problema siguió siendo importante a principios del siglo veinte, donde toda filosofía de las matemáticas debía explicar y aclarar su postura frente a Kant. Por ejemplo, Hans Reichenbach, fundador de Círculo de Berlín, sostiene en un libro publicado en 1951 que “No hay síntesis a priori en la geometría: o la geometría es a priori, y entonces es analítica, o la geometría es sintética y entonces es geometría física y empírica. La evolución de la geometría culmina en la desintegración de la 128 Tomado de (Burris, 2003, p. 8). 1.9. C UESTIONES COMPLEMENTARIAS 85 síntesis a priori.” (Reichenbach, 1953, p. 149). De hecho, esta cuestión se encuentra entre las causas iniciales de muchas investigaciones en torno a los fundamentos de la matemática, siendo una invención decir que el motivo principal de las mismas era asegurar las bases del edificio matemático.129 1.9.3. El punto de vista de Hilbert En una conferencia pronunciada en 1930 Hilbert expone con cierto detenimiento su punto de vista con relación al conocimiento geométrico.130 Sostiene que además de la experiencia y la deducción lógica, disponemos de cierto discernimiento a priori necesario para la construcción de un marco teórico para la realidad. Tal discernimiento es subyacente a la génesis de nuestro conocimiento. No obstante, la frontera de este a priori lo traza de otra manera que Kant, tanto para la aritmética como para la geometría. En su opinión, Kant sobreestimó el papel y el alcance del a priori en ambos casos. Dice al respecto: En los días de Kant se podía pensar que las representaciones [Vorstellungen] que uno tenía del espacio y del tiempo eran aplicables de un modo tan inmediato y general a la realidad como, por ejemplo, nuestras representaciones de número, sucesión y cantidad, las cuales se utilizan constantemente en la manera que nos es familiar en la teoría matemática y física. Pero entonces la teoría del espacio y el tiempo (y en particular la geometría) precedería, como la aritmética, nuestro conocimiento de la naturaleza. No obstante, el punto de vista de Kant fue abandonado por Riemann y Helmholtz incluso antes de que la teoría física obligara a hacerlo, y con toda razón, pues la geometría no es otra cosa que esa parte del marco de los conceptos físicos que modela las posibles relaciones de posición entre los cuerpos rígidos en el mundo de las cosas reales.” (Hilbert, 1930. Cita tomada de Ewald, 1996, p. 1162).131 Fue así como Hilbert despojó a la geometría elemental del poder de determinar las propiedades del espacio sintéticamente y a priori. Lejos de Kant, Hilbert ve en ella una ciencia cuyo cometido es describir la forma externa de las cosas que se nos manifiestan al observar la naturaleza. Esta postura la subraya con las siguientes palabras: “[. . . ] hay principios que Kant considera a priori y que nosotros asignamos a la experiencia; por ejemplo, la totalidad de los hechos fundamentales de la geometría, así como las propiedades elementales del espacio y la materia”. (Hilbert, 1993, p. 124). De lo anterior se sigue la imposibilidad de establecer las propiedades del espacio por pura 129 Al respecto, podemos decir que las antinomias de la teoría de conjuntos (y otras paradojas que pronto veremos) no fueron sino un acuciante problema que apremió la búsqueda de una solución final al problema de los fundamentos, pero no su origen. 130 (Hilbert, 1930a). 131 En cuanto a las “relaciones de posición”, éstas sólo se plantean como posibilidades, debiendo ser confirmadas o refutadas en la experiencia. V. gr., el que haya cuerpos rígidos móviles y cuáles sean sus relaciones de posición es una cuestión de la experiencia, no algo determinado a priori. 86 1. E UCLIDES , K ANT, H ILBERT Y ... reflexión, ya que es en la contemplación intuitiva de los hechos espaciales donde nace la geometría. Su punto de partida es doble: por un lado, la experiencia u observación; por el otro, nuestra percepción de las relaciones espaciales (es decir, la manera en que percibimos tales relaciones).132 En el caso de la geometría, la observación de las configuraciones espaciales se da en el marco de lo que Hilbert refiere en alemán con el vocablo “Anschauung”, que podemos explicar como “intuición o contemplación intuitiva con una fuerte carga de evidencia”. Esta es la fuente de muchos axiomas; es también la fuente de muchos de sus teoremas como, por ejemplo, el relativo a la igualdad entre los ángulos de la base de un triángulo isósceles. La aceptación inmediata de tales hechos geométricos resulta de la consideración intuitiva de las figuras y es lo más cercano que tenemos al apriorismo en geometría. Al respecto, Hilbert parece admitir que la forma en que percibimos las relaciones espaciales es la descrita por la geometría euclidiana. Esto no obliga a nada con relación a los fenómenos, pues nuestra percepción es inexacta. Al axiomatizar idealizamos tales observaciones, dándoles un carácter de absoluta exactitud y generalidad. Así, aunque partimos de observaciones que son válidas dentro de ciertos límites de exactitud, en los axiomas substituimos los resultados de las mismas con aseveraciones de total precisión y universalidad. Pero entonces la teoría axiomática es acerca de relaciones ideales entre objetos ideales. En otras palabras, la validación intuitiva de los axiomas deja de ser un fundamento para la teoría. Es más, tal validación escapa de las matemáticas.133 Al mismo tiempo, como ya lo hemos visto, el matemático queda en libertad de interpretar los términos geométricos y sus relaciones como le plazca. Así, frente a la idea de una teoría que trata con un fuerte núcleo de “realidad geométrica” o “intuición intersubjetiva”, Hilbert coloca, independientemente de su origen, una teoría abstracta que trata con términos susceptibles de distintas interpretaciones. Llegar a estas ideas no fue cosa de un día, sino el resultado de largas reflexiones en las que Hilbert hubo de ponderar el carácter de la nueva matemática. En particular, 132 Para Hilbert la axiomatización constituye una etapa superior en el desarrollo de la geometría. Al respecto, el propósito inicial de la axiomatización es ordenar los hechos y los conceptos que conforman esta esfera del conocimiento. Años más tarde diría algo semejante de todas las teorías matemáticas y de la física. Dicha ordenación se logra, en sus palabras, “recurriendo a una trama de conceptos relacionados entre sí, de tal manera que a cada objeto y a cada hecho del campo del conocimiento de que se trata le corresponda, respectivamente, un concepto de esa trama y una relación lógica entre conceptos. La trama de conceptos no es otra cosa que la teoría de esa esfera del saber.” (Hilbert, 1993, p. 23). Como ya lo hemos visto, en el caso específico de la geometría dichos conceptos son los de punto, línea, triángulo, etc.; y los hechos relevantes los de incidencia, congruencia, paralelismo, etc., entre puntos, líneas, planos y otras figuras. Las expresiones que Hilbert utiliza para referirse a tales hechos (“A está en a”, “A está entre B y C”, “a y b son paralelas”, “AB es congruente con CD”, etc.) corresponden en el orden lógico a relaciones entre los objetos de nuestra intuición. 133 En efecto, para determinar la corrección o no de la teoría geométrica respecto del espacio físico debemos recurrir a la experiencia, donde se le ha de poner a prueba junto con ciertas convenciones como, por ejemplo, que en el espacio físico las ‘líneas rectas’ son las trayectorias de los rayos de luz. Esa cuestión ya no compete a las matemáticas. 1.9. C UESTIONES COMPLEMENTARIAS 87 como ya lo hemos señalado, tanto la geometría proyectiva como las geometrías no euclidianas aportaron suficientes elementos como para poner en tela de juicio la visión tradicional. Esto obligó al método axiomático a que diera cuenta de su condición, pues a finales del siglo diecinueve ya no era creíble un punto de vista como el de Kant. 1.9.4. Un epígrafe tomado de la Crítica de la razón pura de Kant Al referirse a los axiomas Hilbert dice que éstos expresan “ciertos hechos fundamentales y conexos entre sí de nuestra intuición.”134 Se trata, por supuesto, de una referencia al origen de la teoría, no de un indicativo acerca de una semántica obligada para sus términos. Para aclarar este punto recordemos la manera en que expone el axioma II.4 o Postulado de Pasch: II.4 (Postulado de Pasch) Una línea que corta un lado de un triángulo y que no pasa por ninguno de sus vértices deberá cortar también otro lado del triángulo. Lo que sorprende de esta presentación es que Hilbert acompaña al axioma con una figura de la no dice nada y de la que no hace ningún uso más adelante ¿Por qué entonces la presencia de ésta? La respuesta se halla en las palabras introductorias a los Grundlagen. Dice Hilbert: La geometría –al igual que la aritmética– requiere para su desarrollo sistemático de un reducido número de principios básicos simples. Estos principios son conocidos como axiomas de la geometría. Establecer axiomas para la geometría e investigar la forma en que se relacionan entre sí es un problema que se ha discutido desde la época de Euclides en diversas y admirables contribuciones a la literatura matemática. El problema en cuestión equivale al análisis lógico de nuestra intuición espacial.135 El sentido de la última frase de la cita se aclara al considerar las palabras de Kant que, a manera de epígrafe, Hilbert coloca al principio de los Grundlagen: “Así, todo conocimiento humano se inicia con intuiciones, pasa de éstas a los conceptos y termina 134 Hilbert 135 Ibid. 1903, p. 1. 88 1. E UCLIDES , K ANT, H ILBERT Y ... en las ideas.”136 Podemos decir entonces que la figura que acompaña al postulado de Pasch es la intuición que explica al axioma, y que éste expresa tal hecho de la intuición en términos de una relación entre los conceptos de “línea”, “triángulo”, “pasar por” y “cortar”. En cuanto al epígrafe, consideramos que su inclusión obedece a la intención de Hilbert de puntualizar el carácter de la teoría que presenta: Se trata de un montaje que inicia con intuiciones, pasa de éstas a los conceptos (a través del análisis lógico de nuestra intuición espacial) y culmina, en su conjunto (i. e., vista como una totalidad), en una teoría que tiene el mismo rango que las ideas en el sentido de Kant, es decir, constituye un objeto de la razón que carece de realidad y que en su perfección sobrepasa la posibilidad de la experiencia. En otras palabras, una vez empalmados los conceptos geométricos en una teoría, ésta alcanza la misma condición que las ideas: trasciende toda posibilidad de verificación absoluta. Esto sucede incluso con algunas de sus partes. Por ejemplo, para comprobar el postulado de las paralelas habría que recorrer el espacio en su totalidad, lo cual resulta imposible. Por tanto, así nos parece, para Hilbert la cita de Kant expone el carácter de su obra. Por otra parte, todo apunta a que Hilbert comparte con Kant la idea de que el conocimiento teórico sólo adquiere significado y objetividad en la experiencia (Kant diría “en las intuiciones”), y que la intuición es una innegable fuente de conocimientos.137 En este sentido ve en la axiomatización una forma de ordenar las teorías que se gestan en el ámbito de la intuición o en la práctica matemática, esclareciendo sus conceptos y supuestos básicos. Es por ello que la axiomatización de la geometría tiene como punto de partida el análisis lógico de nuestra intuición espacial, a fin de determinar su forma abstracta. Por su parte, los axiomas resultan de precisar la forma lógica de ciertos juicios relativos a conceptos espaciales de los que, supuestamente, se derivan las propiedades relevantes del espacio. El fruto es una teoría cuya exposición se realiza al margen de toda intuición y que en rigor ya no depende de ella. Producir dicha teoría es el papel del análisis lógico.138 136 Kant, Crítica de la razón pura, A702, B 730. [So fängt denn alle menschliche Erknennitnis mit Anschauungen an, geht von da zu Begriffen und endigt mit Ideen.] Como ya lo hemos dicho, la voz que Kant utiliza para referirse a la intuición, “Anschauung”, tiene en alemán una acepción un tanto más precisa que el vocablo “intuición” en español, y que aquí repetimos: Anschauung ≈ intuición con una fuerte carga de evidencia. Por ejemplo, Kant diría que un juicio como “el camino más corto entre dos puntos es la línea recta” toma toda su fuerza en la siguiente figura: y añadiría que sin esta intuición el juicio no tiene fundamento. Es así que el carácter sintético a priori que Kant atribuye a este juicio descansa en la evidencia intuitiva, en el Anschauung. En español, para expresar el origen intuitivo de este juicio, deberíamos darle la siguiente forma: “Veo que el camino más corto...”, o “A mi modo de ver, el camino más corto...”, incorporando de esta manera el sentido del vocablo alemán. 137 Esto no quiere decir que para Hilbert la aritmética transfinita de Cantor o la teoría de los números reales, que suponen ideas que rebasan el plano de lo intuitivo, no tengan justificación, sino que en un sentido estricto no son conocimiento de nada. 138 En este sentido, la obra de Hilbert es efectivamente una continuación y puesta en forma de la 1.9. C UESTIONES COMPLEMENTARIAS 89 Una diferencia entre Hilbert y Kant es que para el segundo los objetos matemáticos son representaciones a priori en la intuición, mientras que para el primero éstos son, al menos en el punto de partida, una idealización de lo que se ofrece en la intuición sensible. No hay que olvidar que Hilbert ya tiene conocimiento de las geometrías no euclidianas y no puede argumentar que dichos objetos pertenecen a la intuición pura. Más bien, ubica el origen de los conceptos y los axiomas geométricos en la consideración de lo que la intuición sensible supone. No ve en los axiomas verdades necesarias, sino proposiciones que pueden ser refutadas por la experiencia o incluso ser contradictorias entre sí: la intuición también nos puede engañar (por ello la necesidad de las pruebas de consistencia). 1.9.5. El análisis lógico: un ejemplo Aclaremos el cometido del análisis lógico con un ejemplo específico. En parte, éste consiste en investigar cómo se vinculan entre sí los puntos y las líneas según nuestra intuición, fijando el tipo de relaciones a que esto da lugar. Observemos la siguiente figura: Como se ve, si tres puntos A, B, C están en una línea recta, uno y sólo uno de ellos está entre los otros dos. La validez de esta afirmación descansa en la evidencia de los sentidos, en la intuición espacial (en el Anschauung)139 , y en ella se indica la manera en que puntos y líneas se enlazan para dar lugar a una relación de orden entre los puntos. La intuición nos “dice” que si nos movemos sobre la línea de A a C, pasaremos por B. También nos “dice” que si nos movemos de B a C no pasaremos por A, incluso si continuamos el movimiento indefinidamente en esa dirección, y que algo semejante sucede respecto a C si nos movemos de B a A. Esto es parte de la naturaleza de la línea recta según nuestra intuición. Podemos entonces afirmar lo anterior escribiendo el axioma II.3 de los Grundlagen: de Euclides quien, como sabemos, no logró independizar del todo la demostración de las intuiciones subyacentes. Prueba de ello es que no reconoció ciertos axiomas que correspondían a otras tantas intuiciones (v. gr., los axiomas de orden o el postulado de Arquímedes) que, sin embargo, intervienen en las demostraciones, sobre todo a través de las figuras. Y hacer tal separación era imprescindible si lo que se quería era llevar a buen término el análisis lógico de nuestra intuición espacial: la lógica no se ocupa de hechos de ninguna especie, sino de deducciones y relaciones entre conceptos. Es por ello que el resultado de tal análisis es el establecimiento de la forma lógica de la teoría geométrica y la instauración de un orden deductivo entre sus proposiciones. 139 Esto es lo que dirían Kant y Hilbert. 90 1. E UCLIDES , K ANT, H ILBERT Y ... II.3 Si A, B y C son tres puntos distintos en una misma línea, entonces uno y sólo uno de ellos está entre los otros dos. Este último enunciado expresa la forma de nuestra intuición espacial, y cualquier representación de los conceptos euclidianos de “punto”, “línea” y “estar entre” habrá de sujetarse a ella, pues esa es la manera en que tales objetos se relacionan. Una característica del axioma II.3 es que obliga a la línea recta a no volver sobre sí misma: Hasta aquí, Kant estaría de acuerdo con el modo de proceder y las conclusiones alcanzadas. No obstante, para Hilbert el límite que separa al a priori de la experiencia se traza de otra manera, reconociendo, como ya lo hemos señalado, que la geometría no es una determinación sintética y a priori de las propiedades del espacio, sino una rama del marco conceptual de la física. Por ejemplo, al interpretar “línea” como “trayectoria de un rayo de luz” podríamos encontrar, con relación a lo anterior, que al lanzar un rayo de luz de B hacia C, al continuar éste su movimiento pasara también por A (es decir, que los rayos de luz en el espacio físico siguieran trayectorias cerradas). Bajo tales circunstancias diríamos que el concepto de “línea recta euclidiana” no es aplicable a los rayos de luz, o que éstos describen trayectorias rectilíneas, pero que el espacio no es el euclidiano y tiene otra forma. En el segundo caso tendríamos un cambio de marco conceptual, lo cual no era imaginable en el siglo dieciocho por la simple y sencilla razón de que no había otras geometrías a la mano. No obstante, nada de esto descalificaría a la geometría euclidiana como tal, pues la única conclusión sería que en el espacio físico los objetos no se comportan (a gran escala) como ella establece. Por ejemplo, en la teoría de la relatividad los físicos convienen en la segunda alternativa, pero hay que tener en cuenta que se trata de un acuerdo. La matemática no legisla acerca de la estructura del espacio físico, ni dice qué objetos de éste son los correspondientes a la línea recta. Por lo demás no podría hacerlo. El propósito del análisis lógico que practica Hilbert es elaborar una teoría acerca del espacio de nuestra intuición y ordenar dicha teoría con apego a la lógica.140 Tampoco es el propósito del análisis lógico dar una definición de los conceptos de “punto”, “línea”, etc. como pretende Frege,141 sino 140 Cabe señalar que “elaborar una teoría acerca de lo que presupone nuestra intuición espacial” no es lo mismo que elaborar una teoría sobre las propiedades del espacio en tanto que condición de posibilidad de toda experiencia, como sostiene Kant. Cf. Kant, 1787, B41 y B59-73. 141 En (Frege, 1980, p. 46) Frege reconviene a Hilbert que su aparente “definición” de las nociones de punto, línea, etc. no satisface la exigencia de responder forzosamente a la pregunta “¿Qué propiedades debe tener un objeto para ser un punto (una línea, un plano)?”, oponiéndose de esa manera a la idea de una definición implícita de las cosas a través de una serie de postulados. 1.9. C UESTIONES COMPLEMENTARIAS 91 exponer, mediante definiciones implícitas, cómo se vinculan entre sí los puntos, la líneas y los planos euclidianos. Llevado al extremo, Hilbert diría, apoyándose en Kant, que no es posible decir en definiciones y axiomas lo que es el espacio y que lo único que podemos hacer es decir nuestra percepción del espacio: puntos, líneas y planos sólo los podemos describir mediante su comportamiento y mutuas relaciones, tal como éstas se expresan en los axiomas, fruto del análisis lógico de nuestra intuición espacial, es decir, del “Anschauung”.142 Como se puede ver en el ejemplo recién expuesto, el análisis lógico de nuestra intuición espacial conlleva la necesidad de separar la forma del contenido de las proposiciones. Repito: la lógica no se ocupa de los hechos geométricos, sino de deducciones y relaciones entre conceptos. En este sentido, el resultado del análisis no puede ser otra cosa que el establecimiento de un orden formal entre conceptos y un orden deductivo entre proposiciones. No obstante, y éste es uno de los puntos centrales de nuestro argumento, Hilbert no olvida que no es la lógica sino la intuición la que convierte a la geometría en un desafío para el entendimiento humano, en vez de uno entre una infinidad de ejercicios intelectuales arbitrarios. Esto explica la profusión de figuras, algunas de gran belleza, que sin intervenir en las demostraciones aclaran el texto mostrando aquello de lo que se habla. Hilbert practica con excelsitud un juego formal en el que ciertos significados prohibidos están siempre ahí, presentes, dando sentido a la teoría, pero sin que se les pueda acusar de nada, pues cuando se les quiere inculpar de algún delito lo único que permanece en su lugar son expresiones vacías. Se trata de un equilibrio que supo mantener a la perfección: separa las palabras de sus denotaciones, pero no lo suficiente como para que éstas no sigan dando sentido a la teoría. En los Grundlagen el único sustento formal de los teoremas es la demostración, pero es la intuición la que señala el camino. Como veremos, Hilbert habrá de afinar este juego cuando intente, en la década de los veinte, hacer valer la matemática transfinita de Cantor con un juego semejante.143 142 Por otra parte, nada nos asegura que el análisis lógico tiene la capacidad de precisar el contenido de nuestra intuición en todos los casos. Más bien, todo parece indicar que el lenguaje no es el medio adecuado para hacerlo. El teorema de Lowenheim-Skolem es una evidencia en contra de la capacidad de nuestro lenguaje para abarcar el contenido de nuestra intuición, e incluso la existencia de modelos no estándar numerables de los axiomas de Peano parece ser suficiente. Esto se relaciona con el problema de la completud de las teorías formales que más adelante veremos. 143 Esto lo logra, por ejemplo, escribiendo fórmulas como “2ℵ0 > ℵ ” que leemos como relativas a los 0 números transfinitos de Cantor sosteniendo a la vez que se trata tan sólo de una sucesión de seis símbolos (¿o es que hay otra cosa sobre el papel?) 92 1. E UCLIDES , K ANT, H ILBERT Y ... Adendo Juicios analíticos y juicios sintéticos En la lógica y la filosofía se distingue entre juicios analíticos y juicios sintéticos. Los primeros se caracterizan por el hecho de que en ellos la noción del predicado está “contenida” en la noción del sujeto, mientras que en los segundo no lo está [Nota. Lo anterior se basa en la idea aristotélica de que los juicios (o aserciones) son oraciones con un sujeto y un predicado, en los que el predicado se afirma o niega del sujeto. El típico ejemplo de ello es el juicio “Sócrates es hombre”. Al respecto, Kant acepta este modelo al momento de clasificar los juicios.] Veamos un ejemplo. Consideremos los juicios “La madre de este niño es una hembra” y “La madre de este niño es amorosa.” En el primer caso el predicado “hembra” está contenido en el predicado “madre” (por definición, una madre es una hembra que ha parido), mientras que en el segundo caso el ser “amorosa” no está contenido en la noción del sujeto (en cada caso habría que ir a la experiencia para verificar la afirmación). Ergo en el primer caso la validación del juicio no pasa por la experiencia, sino por el análisis de los conceptos involucrados, y es por ello un juicio analítico [de hecho, Kant se basa en esta idea al sugerir que ningún filósofo podría responder a la pregunta ¿a qué son igual los ángulos internos de un triángulo? mediante el simple análisis de los conceptos de recta, ángulo, etc., pues en su opinión todas las respuestas que éste podría ofrecer serían juicios analíticos.] Por el contrario, la validez del segundo juicio habría que confirmarla, es decir, habría que ver si la madre aludida es en realidad amorosa, pues no todas las madres lo son. Se trata, por tanto, de un juicio sintético: en el predicado se afirma algo que no radica en el concepto del sujeto, es decir, algo que no siempre es así. De eso se tratan los juicios sintéticos: en ellos la noción del predicado no está contenida en la noción del sujeto. En general, esta clase de juicios requieren de la observación o experiencia para ser validados. V. gr., “Hoy es lunes”. Esto se relaciona con el significado de las expresiones a priori y a posteriori, las cuales se utilizan para distinguir un conocimiento que no depende de la experiencia de uno que sí lo hace. Por ejemplo, los juicios “La madre de este niño es una hembra” y “La madre de este niño es amorosa” serían, el primero a priori y el segundo a posteriori. Los juicios a priori son universales y necesarios, mientras que los juicios a posteriori suelen asociarse con lo particular y lo contingente. “El oro es un metal” (a priori), “Ningún soltero es casado” (a priori) vs. “El día está soleado” (a posteriori) o “Ningún soltero es francés” (a posteriori). Que los juicios analíticos son a priori no presenta mayor problema, y lo mismo se puede decir de los juicios a posteriori, que son sintéticos. Pero, ¿habrá juicios sintéticos a priori? Al respecto, Kant sostiene que sí los hay y que, en particular, los juicios de la matemática son un ejemplo de ello. Esta tesis ha constituido desde siempre un tema polémico con relación a la filosofía de Kant. Se trata de algo que él no discute, pues lo asume como un hecho. En otras palabras, su problema no es probar que los juicios de la matemática son sintéticos a priori, sino explicar cómo es que son posibles. Capítulo 2 La matemática moderna y la teoría de conjuntos 2.1. La nueva matemática En el siglo diecinueve la matemática experimentó un vigoroso impulso hacia la abstracción, y una mayor exigencia de rigor en prácticamente todas sus ramas. Estos cambios volvieron obsoleta la idea de que su papel consistía en reflejar diversos aspectos de la realidad física y que en ello encontraba su fundamento. Esta tendencia cobró fuerza sobre todo en la segunda mitad del siglo, trayendo consigo la idea de que la matemática no es sino una enorme construcción conceptual libre de determinar su objeto. Tal desarrollo dio lugar a la consideración de nuevas teorías, sin importar si estas eran o no aplicables al mundo físico. Estos cambios proporcionaron un novedoso perfil a la matemática del siglo veinte, y pusieron en evidencia lo erróneo de opiniones como la de Lagrange, en el sentido de que la matemática ya había llegado a su límite.1 1 La actividad matemática también se expandió en el siglo diecinueve en otros sentidos. En primer lugar el número de matemáticos aumentó con el incremento de la educación y la proliferación de nuevos centros de investigación, principalmente universidades. En segundo lugar, el número de sociedades científicas y publicaciones especializadas también se incrementó significativamente. Se estima que hacia fines del siglo diecinueve el número de revistas dedicadas total o parcialmente a la publicación de temas de matemáticas se contaban por cientos, (hoy en día se cuentan por cientos las que se dedican exclusivamente al tema). Además, la barrera de la incomunicación fue cediendo lentamente. Desde mediados del siglo diecinueve, en las universidades se acostumbra realizar seminarios bajo la dirección de uno o varios académicos, a menudo profesores invitados, a los que suelen asistir numerosos estudiantes. Esta práctica facilita el análisis de los problemas del momento, así como el estado en que se encuentran las investigaciones. Asimismo, desde el año de 1900 se realiza cada cuatro años un congreso internacional y continuamente se celebran reuniones, coloquios y seminarios en todo el mundo. La expansión de la actividad matemática dio lugar a otros cambios no tan loables. Las diferentes disciplinas se independizaron, desarrollando su propio lenguaje y conceptos, y sus problemas se hicieron cada vez más especiales y sólo accesibles a los expertos, requiriendo para su solución de técnicas 93 94 2. L A MATEMÁTICA MODERNA Y LA TEORÍA DE CONJUNTOS El ejemplo más representativo de esta tendencia hacia dominios de mayor abstracción se dio en la teoría de conjuntos de Cantor, en la que se consideran entes como la totalidad de los números reales o el conjunto de todos los conjuntos de números naturales, a los que nada empírico corresponde, pero que son tratados como realmente existentes, al punto de realizar operaciones con ellos. La aparición de este novedoso punto de vista condujo a un estado de incertidumbre: si la matemática trataba con sistemas de objetos hipotéticos, ¿qué había con relación al “sentido de la verdad”? Como ya vimos, este problema se puso de manifiesto con la separación de la geometría del espacio físico, y fue lo que llevó a Hilbert a preguntarse si la geometría, vista como un ejercicio abstracto, era una totalidad consistente y completa. Obviamente, esta cuestión era extensible a todas las disciplinas de características similares y en su respuesta favorable Hilbert vio la única manera de dar un sentido racional a las teorías matemáticas. No es nuestro propósito examinar en este capítulo todos los cambios habidos en la matemática durante el siglo diecinueve y principios del veinte. En vez de ello, nos limitaremos a señalar algunos pasajes que ilustran a la perfección el carácter de una nueva matemática que poco a poco se fue alejando de “lo real” (o supo volver a él por caminos inesperados), hasta abandonar de manera irremediable su pretensión de verdad acerca de la naturaleza. Tales cambios se dieron de manera paulatina y sus orígenes los podemos situar justo al final del siglo dieciocho en la obra de Carl Friedrich Gauss (1777-1855).2 Si hasta ahora nos hemos circunscrito a lo sucedido en el ámbito de la geometría es porque ahí se muestra con toda claridad el nuevo enfoque axiomático, con el que Hilbert pretende resolver el problema de los fundamentos de la matemática, el cual será objeto de los teoremas limitativos de Kurt Gödel. 2.2. El álgebra moderna Hasta principios del siglo diecinueve se podía argumentar que el álgebra tenía sus raíces en el estudio de relaciones entre magnitudes y cantidades que figuran en el mundo físico, esto a pesar de la aparición de conceptos como los de número negativo y número imaginario. En contra de esta postura, en el siglo diecinueve el álgebra presenció particulares. Así, desde el siglo veinte los matemáticos trabajan normalmente en una sola área (se considera que Hilbert y Poincaré fueron los últimos en conocer toda la matemática de su tiempo), y las publicaciones no están dirigidas a un amplio público, careciendo la mayoría de ellas de indicaciones acerca de la conexión de los temas tratados con otras áreas. 2 Simbólicamente, podemos fijar en 1796 el inicio de la renovación de la matemática cuando Gauss probó su famoso teorema según el cual un polígono regular con un número primo p de lados (3, 5, 7, 11, 13, 17, ...) se puede construir con regla y compás sí y sólo si el número p es de la forma 2k + 1, donde k es una potencia de 2, es decir, de la forma 2n . Tanto valoró Gauss este descubrimiento que en su tumba se encuentra grabado un polígono de 17 lados. Lo que tiene de original este trabajo con relación al espíritu de su época es que en él se demuestra una imposibilidad: la de realizar ciertas construcciones con regla y compás. Este recurso de probar imposibilidades es propio de la matemática moderna y Gödel es un buen exponente de ello. 2.2. E L ÁLGEBRA MODERNA 95 el surgimiento de nuevas ramas en las que los símbolos dejaron de corresponder directamente a magnitudes y números ligados al entorno físico. Libre de la obligación de pensar en la extensión o la cantidad, el álgebra se dio a la tarea de imaginar otra clase de entidades cuyas propiedades se expresaban mediante reglas formales que sólo atañen a la manipulación de los símbolos, creando de este modo teorías no ligadas a las representaciones tradicionales.3 Así, por ejemplo, el álgebra de Boole o los cuaternios de Hamilton. Esta condición de las nuevas teorías, no ligadas a ninguna representación e indiferentes a su origen, les confirió un carácter no muy lejano al de las ideas en el sentido de Kant. Fue por ello que hacia 1900, cuando las matemáticas ya se habían disociado de la ciencia natural, el método axiomático formal se convirtió en el instrumento ideal para desarrollar sus teorías, sin la necesidad de otorgar a sus términos un significado específico. 2.2.1. El álgebra de Boole Bertrand Russell afirma que las matemáticas puras nacieron en 1854 con la publicación del libro The Laws of Thought (Las leyes del pensamiento) de George Boole (18151864). Aunque esto no deja de ser una figura retórica, tiene la virtud de resaltar el carácter de dicha obra, en la que abiertamente se incumple el precepto de que los símbolos han de representar números o cantidades. El libro se inicia con las siguientes palabras: El plan de este tratado es investigar las leyes fundamentales de aquellas operaciones de la mente por medio de las cuales se lleva a cabo el razonamiento, darles expresión en el lenguaje simbólico de un cálculo, y sobre este fundamento establecer la ciencia de la lógica y construir su método.4 Para ello Boole utiliza fórmulas similares a las del álgebra en las que las letras no representan números, sino clases o proposiciones a las que somete a reglas análogas a las del álgebra, poniendo en evidencia que las leyes de la lógica son matemáticas en su forma: Se admite que la lógica, como ciencia, es susceptible de amplias aplicaciones; pero es igualmente cierto que su forma y sus procesos son matemáticos. Por tanto, cualquier objeción a priori que pudiera suponerse dirigida en 3 Este rasgo del álgebra es muy importante para nuestro estudio y habremos de volver a él más adelante. Por lo pronto lo único que pretendemos es dirigir la atención del lector hacia este aspecto característico de la nueva matemática, y que Hilbert habría de llevar al extremo. Una ley numérica como “x + y = y + x”, ¿es un enunciado acerca de números, o es una sucesión de símbolos escritos en el papel? En el segundo caso podemos interpretar la igualdad como una regla de manipulación formal que permite, por ejemplo, escribir “5 + 7” en vez de “7 + 5”, o “# + @” en vez de “@ + #”, algo así como una regla de sustitución. 4 Boole, 1854, p. 1. 96 2. L A MATEMÁTICA MODERNA Y LA TEORÍA DE CONJUNTOS contra de la adopción de tales formas y procesos en la discusión de un problema de moral o de filosofía en general, debe tener como base una incorrecta percepción o una falsa analogía. No forma parte de la esencia de la matemática estar atada con las ideas de número y cantidad. El que como un hábito general sea deseable que la mente aplique procesos simbólicos a la argumentación moral, eso es otro problema.5 Libre interpretación de los símbolos, cálculo y procesos formales, abandono del número y la cantidad: todas las características de la matemática moderna están presentes en la obra de Boole. En The Laws of Thought se tiene una sola teoría (el álgebra de Boole como se le conoce actualmente) que dispone al menos de dos interpretaciones, la primera en términos de clases, y la segunda en términos de proposiciones o enunciados. Veamos a manera de ejemplo dos posibles lecturas de algunos de sus símbolos: Lógica de clases El símbolo 1 es El Universo, es decir, la clase cuyos elementos son todas las cosas de las que se habla. El símbolo 0 es La Nada, es decir, la clase que no tiene elementos. x +y es la clase de todas las cosas que son elementos de x o elementos de y; x × y es la clase de todas las cosas que son elementos de x y elementos de y.6 Lógica de proposiciones El símbolo 1 es Lo Verdadero, es decir, una proposición que comprende todos los hechos posibles. El símbolo 0 es Lo Falso, es decir, una proposición que no comprende ningún hecho posible. x + y es una proposición que es verdadera cuando una de las proposiciones xoy es verdadera; x × y es una proposición que es verdadera cuando ambas proposiciones x e y son verdaderas.7 Además de las literales x, y, z, etc. y de los signos +, −, × que representan operaciones, en el álgebra de la lógica se cuenta con el signo = para la identidad y una operación de complementación x a la que nada corresponde en la aritmética. Con relación a las clases, el complemento x de una clase está formado por todas las cosas que no son elementos de x, mientras que en la lógica de proposiciones x es una proposición que es verdadera si y sólo si x es falsa. En su uso, estos símbolos están sujetos a leyes, en parte concordantes con las del álgebra ordinaria y en parte no. Por ejemplo, se tienen las siguientes identidades, que siguen siendo válidas cuando se les interpreta como igualdades numéricas: 5 Op. cit., p. 12. adelante, escribimos, como es usual, xy en vez de x × y. 7 Algunas de estas definiciones las hemos modificado para ajustarnos a la interpretación moderna de estos símbolos. Por ejemplo, la definición que figura en el tercer renglón Boole la expone así: x + y es la clase de todas las cosas que son elementos de x o elementos de y, pero no de ambas clases, lo que corresponde al “o” excluyente de la lógica actual, y que escribiríamos así: (x + y) − xy. 6 En 2.2. E L ÁLGEBRA MODERNA xy = yx x+y = y+x 97 x(y + z) = xy + xz 1x = x x+0 = x En cambio, las siguientes identidades del álgebra de la lógica no son válidas cuando se les lee como ecuaciones numéricas: xx = x x+x = x x + (yz) = (x + y)(x + z) Una cuestión que Boole establece con todo cuidado en The Laws of Thought es que si bien su álgebra lógica no se identifica con el álgebra general de los números, sí lo hace con algo más limitado: el álgebra de los números 0 y 1, constituida por aquellas leyes que son verdaderas cuando las variables x, y, z, etc. se interpretan como representativas de 0 y 1 y las operaciones + y × se definen como sigue: 0 + 0 = 0, 0 × 0 = 0, 0 + 1 = 1, 0 × 1 = 0, 1+0 = 1 1×0 = 0 y y 1+1 = 1 1 × 1 = 1.8 A más de ciento cincuenta años de su invención, el álgebra de Boole sigue siendo objeto de estudio. Si bien en la lógica se le considera un capítulo de la lógica de predicados y su notación ha sido abandonada en favor del simbolismo de Russell y Peano, en otras áreas es objeto de nuevas generalizaciones, como por ejemplo en la teoría de latices o en la de los conjuntos parcialmente ordenados. Otro lugar en el que se le sigue utilizando es en el diseño de circuitos eléctricos, donde los valores 1 y 0 se interpretan como “el interruptor x permite (no permite) el paso de corriente eléctrica” y las operaciones × y + se definen, respectivamente, como la conexión en serie y en paralelo de los interruptores. Tales aplicaciones han sido especialmente importantes en la computación y son una muestra de la libertad que se tiene para interpretar los símbolos algebraicos más allá de la esfera de los números: una conquista del siglo diecinueve. 2.2.2. Los cuaternios de Hamilton Así como en la geometría se llegó a creer que no era posible ningún sistema distinto del euclidiano, de igual forma en la aritmética se llegó a creer que no era posible ningún sistema distinto al del álgebra ordinaria. Esto fue enunciado por George Peacock (17911854) en 1842 bajo el nombre de Principio de permanencia de la forma. Según este principio, las operaciones con expresiones literales han de ser las mismas para cualquier clase de números y coinciden con las del álgebra de los enteros positivos cuando los 8 Op. cit, p. 37. La identificación que hace Boole no es completa: hay leyes que se cumplen en el álgebra de 1 y 0 y que no lo hacen en el álgebra de la lógica. Por ejemplo, la ley “si z = 0, entonces zx = zy implica x = y” se cumple en el primer caso, pero no en el segundo. No obstante, lo que sí es cierto es que el álgebra de proposiciones es idéntica con el álgebra de 1 y 0, pues en tal caso cada proposición x es verdadera (es decir, x = 1) o es falsa (es decir, x = 0). 98 2. L A MATEMÁTICA MODERNA Y LA TEORÍA DE CONJUNTOS símbolos son generales en su forma. De este modo, cualquier operación algebraica válida para los enteros positivos sería válida en general. Por ejemplo, conforme a este principio, la expresión a(bc) = (ab)c, al afirmar una propiedad válida para todos los enteros, afirmaría una propiedad válida para todos los a, b y c, y por lo tanto válida para los números complejos (pues la forma permanece). Así, estableciendo propiedades de los números enteros en forma simbólica se podría establecer enunciados simbólicos generales. Peacock en particular se sirvió de este principio para justificar las operaciones con los números complejos, mismas que no contaban con ningún fundamento, pero que resultaban sumamente útiles en la teoría de ecuaciones. Para nosotros es difícil entender lo que este principio significó en su momento. Expresa de manera arbitraria que los distintos tipos de números comparten con los números enteros las mismas propiedades formales, como si todos ellos estuviesen engarzados por un mismo hilo en la escritura. Este principio, que en realidad es una regla injustificada, lo apoyaron en las siguientes leyes, que eran utilizadas como axiomas en el álgebra: 1. Si a cantidades iguales se añaden otras iguales, los totales son iguales. 2. Si a cantidades desiguales se añaden otras iguales, los totales son desiguales. 3. a + (b + c) = (a + b) + c (ley asociativa para la suma) 4. a + b = b + a (ley conmutativa para la suma) 5. a(bc) = (ab)c (ley asociativa para el producto) 6. ab = ba (ley conmutativa para el producto) 7. a(b + c) = ab + ac (ley distributiva) Esta regla comprendía en realidad dos aspectos divergentes. Por una parte tenía un aire de tesis metafísica acerca de la naturaleza de los números y, en su momento, contaba con el sostén de que los distintos sistemas conocidos compartían con los números enteros las mismas propiedades generales. Por otra parte, permitía pensar las propiedades de los números en términos puramente simbólicos, lo cual concordaba con la opinión de algunos algebristas del siglo diecinueve, que consideraban que el álgebra era una ciencia que trataba con símbolos no interpretados y con las leyes que gobiernan su combinación, y que la selección de tales leyes era enteramente arbitraria.9 El principio de la permanencia de la forma sucumbió cuando William Rowan Hamilton (1805-1865) dio a conocer ciertos objetos numéricos cuyas propiedades contravienen algunos de estos axiomas, como por ejemplo la ley conmutativa para el producto. En 1843 Hamilton concibió una teoría en la que consideraba una nueva clase de objetos, los cuaternios. Su intención era construir un álgebra apropiada para el estudio de las 9 Entre tales algebristas se encontraban Augustus de Morgan (1806-1871), Duncan F. Gregory (18131844) y el mismo Peacock. 2.2. E L ÁLGEBRA MODERNA 99 fuerzas que actúan sobre un cuerpo en el espacio tridimensional, aunque también lo hacía por curiosidad, para ver “qué sucedía”. El problema en cuestión ya se había resuelto en el caso del plano y la solución se valía de la representación de vectores por medio de los números complejos.10 Hamilton pensó que generalizando la noción de número complejo al espacio tridimensional tendría una solución al problema. Veamos. Desde tiempo atrás se sabía que las fuerzas se podían representar mediante entidades cuyas características son las de los hoy llamados vectores, e incluso se conocía la llamada Ley del paralelogramo, según la cual la diagonal del paralelogramo formado por dos vectores u y v proporciona la magnitud y la dirección de la fuerza resultante, tal como se muestra en la figura (v.gr., Newton lo hace). A esta forma de representar fuerzas por medio de segmentos dirigidos se anexó la representación de los números complejos por medio de puntos en el plano, gracias a los esfuerzos de Caspar Wessel (1745-1818), Jean Robert Argand (1768-1822), Gauss y el 11 El mérito de Hamilton fue que disolvió el problema de mismo Hamilton, entre otros.√ la naturaleza del número i ó −1, que no parecía corresponder a nada intuitivo, pero que era una herramienta indispensable en las operaciones. En un trabajo publicado en 1836, Hamilton observó que un número complejo de la forma a + bi sólo representa una suma en sentido figurado, pues a y bi no pueden sumarse como 7 y 5 lo pueden hacer y mostró que este número puede definirse como la pareja ordenada de números reales (a, b). Así, las propiedades de los números complejos pasaron a depender de su definición como parejas ordenadas de números reales y de la definición de las operaciones básicas con ellos, que son tres: (a, b) + (c, d) = (a + c, b + d) (a, b) · (c, d) = (ac − bd, ad + bc) ac + bd bc − ad (a, b) = + (c, d) c2 + d 2 c2 + d 2 Con estas definiciones las propiedades algebraicas de la suma y el producto (leyes asociativa, conmutativa, etc.) se pueden deducir como una consecuencia de las propiedades de los números reales. Además, los número reales se pueden considerar como un subsistema del sistema de los números complejos, identificando la pareja (a, 0) con el número real a, y la pareja (0, b) con el número imaginario bi. √ √ Por ejemplo, −1 · −1 = (0, 1) · (0, 1) =de f (0 · 0 − 1 · 1, 0 · 1 + 1 · 0) = (−1, 0) = −1, 10 Un vector, en el plano o en el espacio, es un segmento dirigido con el que se representan la dirección y la magnitud de una fuerza, una velocidad o una aceleración. 11 Véase el apéndice E que contiene una nota acerca de los números complejos y su representación en el plano. 100 2. L A MATEMÁTICA MODERNA Y LA TEORÍA DE CONJUNTOS con lo que se tiene el siguiente resultado ya conocido: desaparece.12 √ √ −1 · −1 = −1. El misterio Como se puede ver en el apéndice E, los números complejos son muy útiles en el estudio de los vectores y las rotaciones en el plano, y por ello fue que Hamilton intentó diseñar un sistema numérico análogo para el estudio de los vectores y las rotaciones en el espacio tridimensional. Contra lo que pudiera parecer a primera vista, tal sistema no tuvo como base ternas ordenadas de números reales, sino cuartetas de números (a, b, c, d) a las que dio el nombre de cuaternios (quaternions).13 Por analogía con los números complejos, el cuaternio (a, b, c, d) lo escribió en la forma a + bi + c j + dk y asignó a las expresiones i, j y k un papel semejante al del número i en los complejos. Las reglas formales para sumar y multiplicar cuaternios son las siguientes: (a, b, c, d) + (a , b , c , d ) = (a + a , b + b , c + c , d + d ) (a, b, c, d) · (a , b , c , d ) = (aa − bb − cc − dd , ab + ba + cd − dc , ac + ca + db − bd , ad + bc + da − cb ) Con estas definiciones Hamilton demostró que los números reales y los números complejos están inmersos en los cuaternios, identificando el número real r con el cuaternio (r, 0, 0, 0) y al número complejo a + bi con (a, b, 0, 0). Asimismo, demostró que la suma de cuaternios es conmutativa y asociativa, y que la multiplicación es asociativa y distributiva respecto a la suma. No obstante, con relación a la multiplicación, la ley conmutativa no se cumple en todos los casos: hay cuaternios x e y tales que xy = yx. Por ejemplo, (0, 1, 0, 0) · (0, 0, 1, 0) = (0, 0, 0, 1) mientras que (0, 0, 1, 0) · (0, 1, 0, 0) = (0, 0, 0, −1) Identificando los símbolos i, j y k con los cuaternios (0, 1, 0, 0), (0, 0, 1, 0) y (0, 0, 0, 1), respectivamente, Hamilton estableció la siguiente tabla de multiplicación entre ellos:14 12 Es decir, la naturaleza de número i queda aclarada como una pareja de números reales. Para obtener la antigua forma de los números complejos a partir de las parejas de Hamilton es suficiente con notar que todo número complejo (a, b) se puede escribir como sigue: (a, b) = (a, 0) + (0, b) = (a, 0) + (b, 0) · (0, 1) = a + bi. De hecho, en la práctica todavía se utiliza esta última notación para los números complejos, pues es más sencillo realizar los cálculos con ella. 13 En retrospectiva, es fácil entender por qué estas entidades habrían de tener cuatro componentes en vez de tres. En principio, su cometido era rotar un vector en torno a un eje dado, a la vez que alargarlo o contraerlo. Para ello se necesitan cuatro parámetros: dos ángulos para fijar el eje de rotación, otro para fijar el ángulo de rotación y uno más para fijar el factor de expansión. Esto trajo como consecuencia la imposibilidad de representar estas entidades mediante vectores en el espacio tridimensional. 14 La escritura de los cuaternios en la forma a + bi + c j + dk permite multiplicarlos como polinomios en i, j y k, simplificando el producto resultante mediante la tabla. Proceder de esta manera facilita el cálculo y no introduce ningún elemento de incertidumbre en la teoría, pues los “números” i, j y k son entidades perfectamente definidas sin ninguna connotación metafísica. 2.2. E L ÁLGEBRA MODERNA · 1 i j k 101 1 1 i j k i i −1 −k j j j k −1 −i k k −j i −1 Si el producto fuera conmutativo la tabla sería simétrica respecto a la diagonal formada por 1 y −1. La idea de una operación no conmutativa, es decir, de una operación para la que el orden en que se consideran los factores es relevante, no fue aceptada sin renuencia. Antes de los cuaternios, el mismo Hamilton se esforzó durante quince años por encontrar una extensión de los números complejos que satisficiera la ley conmutativa de la multiplicación, hasta que una tarde le sobrevino la idea de abandonarla. Cuenta la leyenda que fue tal su impresión, que la tabla anterior la talló en las piedras de un puente de Dublín por donde paseaba en ese momento: la ruptura con el principio de la permanencia de la forma se había consumado. Una de las ventajas de haber liberado al concepto de número de la penosa necesidad de representar magnitudes físicas o espaciales fue que éste se pudo generalizar de distintas maneras. Así, por ejemplo, en 1844 Hermann Grassmann (1809-1877) publicó un trabajo titulado Die lineale Ausdehnungoslehre (El cálculo de la extensión) en el que desarrolla ciertos sistemas algebraicos de mayor generalidad que los cuaternios. En vez de tratar, como Hamilton, sólo con cuartetas de números reales, Grassmann considera sucesiones finitas (x1 , . . . , xn ) de éstos. A cada una de estas sucesiones le hace corresponder un número hipercomplejo x1 e1 + x2 e2 + . . . + xn en , donde e1 , e2 , . . . , en son las unidades fundamentales de su álgebra. Tales números hipercomplejos se suman y multiplican como polinomios en e1 , e2 , . . . , en . En particular, para calcular el producto de dos números cualesquiera es necesario disponer de tablas similares a la que Hamilton introdujo para los cuaternios. No obstante, en tales casos se cuenta con un amplio margen de libertad, pudiéndose construir distintas álgebras a través de distintas tablas, dependiendo de las leyes algebraicas que se quieran preservar. Aun sin explicar en detalle los trabajos de Hamilton y Grassmann, podemos decir que su importancia histórica radica en que hicieron valer el derecho de crear sistemas abstractos regidos por leyes distintas a las del álgebra tradicional y abrieron el camino para explorar nuevos e innumerables sistemas. El álgebra moderna se vale de este recurso y, en cierto sentido, aún marcha por la misma senda, creando y comparando sistemas mediante la adición, supresión, debilitamiento y/o sustitución de postulados.15 Este 15 Así, por ejemplo, de los axiomas de campo se pueden obtener los axiomas de anillo, anillo conmutativo, anillo con división (los cuaternios son un ejemplo de ello), dominio entero, anillo unitario y grupo, siendo quizá esta última noción la más importante del álgebra moderna. Acaso sea correcto decir que los matemáticos han estudiado en detalle cientos de estructuras de este tipo y sus mutuas relaciones. Un efecto de tal abstracción fue el descubrimiento de similitudes entre estructuras que en apariencia no tenían nada que ver entre sí, pero que resultaban ser modelos de un mismo sistema algebraico, así como el encuentro de nuevas analogías y generalizaciones. Fue un momento creativo en el que, cambiando las reglas de diversos sistemas abstractos, se inventaron nuevas teorías con aplicaciones imprevistas. 102 2. L A MATEMÁTICA MODERNA Y LA TEORÍA DE CONJUNTOS trabajo va acompañado de la creación de estructuras abstractas como representación de las nuevas teorías, y que sólo tienen existencia en un sentido matemático. 2.3. La teoría de grupos y el programa de Erlangen El uso de nociones cada vez más generales pronto dejó ver la afinidad entre diversas estructuras matemáticas. Tal fue el caso del concepto matemático de grupo, quizá el más fecundo de la matemática moderna. La teoría de grupos ejemplifica a la perfección un hecho que pudiera parecer paradójico a primera vista: el que una teoría, desarrollada en un principio por su utilidad en la matemática misma, se convierta de súbito en una herramienta esencial de otras disciplinas científicas, como la física en este caso. Aunque con anterioridad ya se habían suscitado casos semejantes –Kepler con las cónicas, Einstein con la geometría de Riemann–, el caso de la teoría de grupos es todavía más sorprendente, pues en apariencia nada tenía que ver con algo tan distante como las partículas elementales, cuya teoría ni siquiera existía ni se vislumbraba en la época en que surgió la teoría de grupos (de esto hablaremos en la siguiente sección). La teoría de grupos se originó en el estudio de la resolución de ecuaciones por parte de Evariste Galois (1811-1832) y cobró vida propia a lo largo del siglo diecinueve en los trabajos de Augustin-Louis Cauchy (1789-1857), Joseph Alfred Serret (18191885), Camile Jordan (1838-1922) y Arthur Cayley (1821-1895), entre otros. En 1872 la noción ya había madurado lo suficiente como para que Felix Klein (1849-1925) propusiera una novedosa manera de definir lo que es una geometría con base en esta teoría, y clasificara las distintas geometrías conocidas en su tiempo a partir de la noción de grupo de transformaciones, subyacente a todas ellas.16 La noción de transformación es muy simple: una transformación de un conjunto X en sí mismo es una correspondencia bajo la cual a cada elemento de X le corresponde un sólo elemento de X (su imagen), y cada elemento de X es imagen de uno y sólo un elemento de él. De ahí el nombre de transformación: cada elemento de X se transforma en otro elemento de ese conjunto o quizá en él mismo. En este contexto el concepto de 16 La noción de transformación es un caso particular del concepto de correspondencia o función que tan importante papel juega en la matemática, y que la caracteriza como algo más que una ciencia que se ocupa de números y magnitudes. A diferencia de la matemática tradicional, dominada por las nociones de medida y extensión, la matemática de al menos la primera mitad del siglo veinte estuvo dominada por las nociones de correspondencia, orden, cambio y arreglo, en las que la idea central es la de correspondencia entre agregados de objetos. En ella, un tema que se repite con insistencia es el de investigar qué propiedades de los objetos considerados se preservan bajo clases específicas de transformaciones, lo que, como ya lo hemos visto en el caso de la geometría proyectiva, no requiere necesariamente del concepto de medida o magnitud, sino del concepto de función. Esta noción floreció en el siglo diecinueve y se hizo presente en prácticamente todas las teorías matemáticas, al grado de que Vito Volterra no vaciló en afirmar en el congreso de 1900 que el siglo diecinueve había sido “el siglo de las funciones.” (cita tomada de Kline, 1994, p. 1348). Las funciones, en tanto que objeto de estudio, ejemplifican muy bien el tipo de entidades de interés para la matemática contemporánea, más allá de la cantidad y las figuras geométricas, y cuya naturaleza abstracta descansa en gran medida en el carácter abstracto de esta noción. 2.3. L A TEORÍA DE GRUPOS Y EL PROGRAMA DE E RLANGEN 103 grupo aparece cuando se introducen las nociones de producto de transformaciones, inversa de una transformación y transformación idéntica. El producto T2 T1 de dos transformaciones T1 y T2 de X es la transformación que resulta de llevar a cabo primero T1 y después T2 . Si denotamos con T (x) al elemento correspondiente a un objeto x bajo una transformación T , entonces el producto se puede definir así: (T2 T1 )(x) =de f T2 (T1 (x)) A su vez, la inversa de una transformación T es la transformación T −1 con la siguiente propiedad: si x es el elemento correspondiente a x bajo T , entonces x es el elemento correspondiente a x bajo T −1 (es decir, T −1 invierte la correspondencia o “regresa” x a x). Con la notación recién expuesta podemos definir T −1 como sigue: T −1 (T (x)) =de f x Por tanto, el producto de una transformación T con su inversa T −1 es una transformación I tal que I(x) = x, llamada transformación idéntica o de identidad. Las transformaciones en el sentido recién expuesto constituyen un grupo, es decir, una estructura algebraica que satisface las condiciones que a continuación se indican. Sea G un conjunto arbitrario y · una operación (función) que a cada pareja (x, y) de elementos de G le hace corresponder un único elemento x · y de G. Se dice que (G, ·) es un grupo cuando se satisfacen los siguientes axiomas: 1. ∀x∀y∀z(x · (y · z) = (x · y) · z) (Asociatividad) 2. Hay un elemento e ∈ G tal que ∀x(x · e = e · x = x) 3. ∀x∃y(x · y = y · x = e) (Elemento neutro) (Elemento inverso) El inverso de x se suele denotar con x−1 . Si además se cumple el siguiente axioma, se dice que el grupo es conmutativo o abeliano: 4. ∀x∀y(x · y = y · x) (Conmutatividad) Si la operación · se interpreta como el producto de transformaciones de un conjunto X, entonces los axiomas 1, 2, 3 se satisfacen y se tiene un grupo (es decir, las transformaciones de un conjunto X siempre constituyen un grupo). En cambio, el axioma 4 no siempre se cumple en el caso de las transformaciones. Consideremos a manera de ejemplo algunas transformaciones en el plano coordenado. Sean T1 y T2 las funciones que al punto de coordenadas (x, y) le hacen corresponder, respectivamente, los puntos de coordenadas T1 : x = 0.6x + 0.4y y =y T2 : x = 0.8x − 0.2y y = −0.1x + 0.9y 104 2. L A MATEMÁTICA MODERNA Y LA TEORÍA DE CONJUNTOS Veamos qué efecto producen estas transformaciones en las siguientes figuras: Estas correspondencias son transformaciones del plano en el sentido indicado, es decir, en ambos casos a cada punto se le hace corresponder una sola imagen, y cada punto del plano es imagen de un solo punto. Ahora consideremos otro tipo de correspondencias (no necesariamente transformaciones) denominadas no lineales, pues sus ecuaciones no son de primer grado, como la de la línea recta. La primera de ellas es una transformación, mientras que la segunda no lo es. Por ejemplo, la parte derecha de la “carita sonriente” ha quedado superpuesta a la parte izquierda. Esto se debe a que la función trigonométrica coseno que figura en una de sus ecuaciones tiene el mismo valor para un argumento x que para su inverso aditivo −x (es una función par). Nótese que los objetos considerados ya no son números o figuras, sino funciones. Provisto de este concepto, Klein propuso la siguiente definición de lo que es una geometría: Una geometría es el estudio de las propiedades de los objetos pertenecientes a un conjunto X que permanecen invariantes cuando los elementos de X se someten a las transformaciones de un grupo G. La geometría en cuestión se denota con (X, G). 2.3. L A TEORÍA DE GRUPOS Y EL PROGRAMA DE E RLANGEN 105 Tradicionalmente, la geometría se había entendido como el estudio de las propiedades de las figuras del espacio. Para mostrar la relación entre esta idea y la definición de Klein, considérese el conjunto X de los puntos en el plano y el conjunto Γ de transformaciones de X consistentes en traslaciones, rotaciones y reflexiones en líneas. Como el producto de dos transformaciones de esta clase y la inversa de cualquiera de ellas pertenece a Γ, (X, Γ) es un grupo. La geometría resultante es la geometría euclidiana métrica del plano, en la que puntos y figuras como triángulos, círculos, líneas rectas, etc. conservan su área, longitud, congruencia, paralelismo, perpendicularidad, concurrencia o colinealidad cuando se les somete a tales transformaciones. Dichas propiedades se dice que son invariantes bajo el grupo Γ, y entre ellas se encuentran las enunciadas en los libros de Euclides y que se refieren a estos conceptos. Por tanto, la geometría euclidiana métrica plana se puede caracterizar como el estudio de las propiedades de las figuras planas que no varían (son invariantes) cuando se les somete a transformaciones rígidas, es decir, a transformaciones que preservan distancias y que no son otras que las pertenecientes a Γ. A esta geometría se le denomina geometría métrica plana. Este modo de ver la geometría tiene la virtud de que permite ordenar las teorías de modo que la relación entre algunas de ellas se hace evidente. Por ejemplo, si a las transformaciones de Γ se añaden las homotecias (es decir, transformaciones en las que cada punto P se transforma en un punto P tal que AP = k · AP, donde A es un punto fijo y k una constante mayor que cero), se obtiene una nueva geometría denominada equiforme, en la que figuras como triángulos, círculos o segmentos ya no conservan su área o longitud, pero sí sus relaciones de perpendicularidad, paralelismo, concurrencia o colinealidad, al igual que las relaciones de orden e incidencia que figuran en los postulados de Hilbert (v. gr., I.1, I.2, II.1, postulado de Pasch, etc.)17 A esta geometría corresponden, además de las anteriores, las propiedades de semejanza que estudia Euclides en sus Elementos. Así, la geometría equiforme es más general que la métrica, y el grupo de transformaciones de la primera contiene como subgrupo al grupo de transformaciones de la segunda.18 Esta posibilidad de clasificar las geometrías parte de la idea (originalmente de Klein) de invertir la relación entre la geometría y los grupos de transformaciones, convirtiendo a éstos en el objeto primordial. Esto permite vincular entre sí distintas geometrías en tanto que partícipes de un mismo grupo de transformaciones, y establecer una relación de subordinación entre las geometrías con base en la noción de subgrupo.19 Así, por 17 Una homotecia es una transformación en la que los ángulos permanecen iguales (son invariantes), las longitudes de los segmentos varían en la misma proporción y los puntos que se corresponden están alineados respecto a un punto fijo llamado centro de homotecia, (el punto A mencionado en la definición). Bajo una transformación homotética, las figuras conservan su forma y proporciones, más no su tamaño. 18 Un subgrupo de un grupo G es un subconjunto X de G que por sí mismo es un grupo bajo la misma operación “·”. Por ejemplo, las rotaciones del plano constituyen un subgrupo del grupo de transformaciones rígidas. 19 A este proyecto de clasificación de las geometrías existentes se le conoce como Programa de 106 2. L A MATEMÁTICA MODERNA Y LA TEORÍA DE CONJUNTOS ejemplo, el grupo de transformaciones proyectivas tiene como subgrupo al grupo de transformaciones afines, y éste último al de transformaciones equiformes que contiene al grupo de transformaciones rígidas. Por tanto, la geometría métrica está comprendida en la geometría equiforme, ésta en la geometría afín y esta última en la geometría proyectiva, de modo que todo teorema de la geometría proyectiva es válido en las demás.20 Aunque no nos detendremos a examinar esta cuestión, podemos decir que la síntesis y codificación de Klein permaneció como algo válido por lo menos hasta el advenimiento de la topología y la geometría algebraica. Su obra ilustra a la perfección los cambios habidos en la matemática a fines del siglo diecinueve, en la que comenzaron a surgir conceptos cada vez más generales y objetos cada vez más abstractos, y en la que las teorías ya no se podían justificar con los viejos argumentos kantianos o con el positivismo del siglo dieciocho. Cerramos esta sección con tres comentarios, los cuales concuerdan o refuerzan lo ya dicho en el capítulo 1: 1. Una diferencia entre la geometría antigua y la que se desarrolla a fines del siglo diecinueve es la falta de concreción de esta última. Muchas de sus teorías proceden sin figuras, y sin hacer uso, aparentemente, de la intuición espacial. En su lugar, se apoyan decididamente en el poder de la herramienta analítica que utilizan, en contraste con los métodos puramente geométricos de antaño. Esto es particularmente cierto respecto al uso de la teoría de grupos por parte de Klein, quien, apoyándose en el álgebra, pone el énfasis en ideas de carácter general –grupo de transformaciones, invariantes–, abarcando una multitud de resultados bajo un mismo aspecto, en vez de centrarse en lo particular. 2. Otra característica de la nueva geometría es su preferencia por la representación simbólica de los objetos, agrupando en fórmulas y ecuaciones diversos casos que trata como uno solo, con lo que logra una notable generalidad y simplicidad. A diferencia de esto, los antiguos siempre refirieron los problemas y los teoremas geométricos a figuras muy bien definidas, y cuando los elementos que en ellas participan (v. gr., puntos y líneas) podían tener diversas posiciones relativas, cada uno de estos casos se consideraba por separado. En este sentido, la geometría antigua sacrifica la universalidad en favor de la concreción de la figura, perdiendo con ello la posibilidad de reconocer los principios generales subyacentes a la teoría. Erlangen, y fue propuesto en 1872 por Felix Klein al ingresar como profesor a la Universidad de Erlangen en Baviera. 20 Hasta mediados del siglo veinte el grupo de transformaciones proyectivas contenía como subgrupos a los grupos de transformaciones de prácticamente todas las geometrías consideradas. Hechos como el anterior llevaron a Arthur Cayley a decir que la geometría proyectiva contenía toda la geometría. En realidad, lo cierto es lo contrario: todos los teoremas de la geometría proyectiva están contenidos en aquellas geometrías cuyos grupos contiene. 2.4. L A FÍSICA CUÁNTICA Y LA TEORÍA DE GRUPOS 107 3. Hay otras diferencias importantes entre la nueva y la vieja matemática que no habremos de abordar en una obra de esta naturaleza, pero que no podemos dejar de mencionar. Una de ellas es que el uso de nociones abstractas como la de grupo permite introducir nuevas ideas (como, por ejemplo, la idea de acción o movimiento) que conducen a una mayor generalidad y abstracción (dado el grupo, escoger un conjunto X y una operación · que lo represente). Asimismo, la nueva matemática favorece el establecimiento de vínculos entre distintas teorías que antes no estaban relacionadas entre sí (v. gr., los números complejos con las geometrías no euclidianas, la geometría con el álgebra vectorial y el álgebra lineal, etc. de lo cual los Grundlagen de Hilbert son un claro ejemplo), o introducir nuevas nociones (como la de espacio de dimensión infinita) y extender los procedimientos a otras áreas (v. gr., llevar la teoría de grupos a la geometría diferencial). Al respecto, el lector interesado podrá consultar algunas obras de carácter histórico en las que estas cuestiones se analizan con cierto detenimiento, como, por ejemplo, Eves, 1976 o Kline, 1994. 2.4. La física cuántica y la teoría de grupos La aparición de la noción abstracta de grupo marcó un hito en la historia de las matemáticas. Se trata sin lugar a dudas de la teoría algebraica con más usos dentro de ella, y su importancia nadie la discute. Se le encuentra poco más o menos en todas partes: en el álgebra lineal, en la aritmética, en la geometría, en la cristalografía, en la teoría de códigos, en el análisis combinatorio, en la teoría de ecuaciones, en las ecuaciones diferenciales, en el análisis matemático y en prácticamente toda el álgebra moderna. Esta generalidad llevó a algunos matemáticos a pensar que la matemática quedaría unificada por ella (v. gr., Klein y Poincaré).21 Si bien esta expectativa no se cumplió, el futuro aún tenía reservada una sorpresa: aunque el concepto provenía enteramente de la matemática, sirvió como pieza fundamental para forjar en el siglo veinte una nueva teoría física, la de las partículas elementales en la mecánica cuántica. Escuchemos a Freeman J. Dyson: El enorme poder de la teoría de grupos en la física deriva de dos hechos. Primero, que las leyes de la mecánica cuántica establecen que, siempre que un objeto físico tiene una simetría, hay un grupo de operaciones G bien definido que preserva la simetría y los posibles estados cuánticos del objeto se encuentran en correspondencia exacta con las representaciones de G. Segundo, que la enumeración y clasificación de todos los grupos de buen comportamiento y sus representaciones ya fue hecha de una vez por todas 21 No obstante, su importancia no fue reconocida de inmediato: si bien ya se habían considerado casos específicos del concepto de grupo, por ejemplo en la teoría de Galois, su exposición como sistema abstracto no se dio sino hasta la segunda mitad del siglo diecinueve en los trabajos de Cayley (1821-1895), Leopold Kronecker (1823-1891), Richard Dedekind (1831-1916), Klein, Sophus Lie (1842-1899) y Walther von Dick (1856-1934), entre otros. 108 2. L A MATEMÁTICA MODERNA Y LA TEORÍA DE CONJUNTOS por los matemáticos, independientemente de la situación física a la que se puedan aplicar. De estos dos hechos resulta la posibilidad de elaborar una teoría enteramente abstracta de las simetrías de las partículas elementales, basada en las cualidades generales de grupos y representaciones y evitando los modelos mecánicos o dinámicos arbitrarios.22 El uso de la teoría abstracta de grupos lo explica Dyson con un ejemplo. Un átomo que flota en un gas rarificado no tiene una dirección preferida en el espacio y, por lo tanto, tiene las simetrías del grupo de rotaciones O3 del espacio tridimensional en torno a un centro O. Entre las distintas representaciones de O3 se encuentra la formada por ternas de números reales. Algunas de éstas corresponden a estados del átomo que tienen una unidad de espín. A éstas se les llama ternas de estado y siempre se presentan en grupos de tres con la misma energía. Si se activa un campo magnético de modo que destruya la simetría rotacional, las tres energías se escinden y los tres estados se pueden ver en un espectroscopio como una terna de líneas espectrales. La clasificación de los estados del átomo conforme a la simetría rotacional es el ejemplo estándar de la aplicación de la teoría de grupos o, como él dice, de la teoría concreta de grupos en acción. Este ejemplo del uso de la teoría de grupos en la física tiene como propósito mostrar la otra cara de la moneda: para la física, la matemática no es sólo una herramienta por medio de la cual los fenómenos pueden ser descritos y sus magnitudes calculadas (como creyeran d’Alambert y Laplace), sino una fuente de conceptos y principios por medio de los cuales se pueden crear nuevas teorías. El ejemplo anterior no es el único que nos puede mostrar este hecho. Quizá el caso más famoso sea el de la teoría de la gravitación de Einstein, mejor conocida como teoría general de la relatividad. Escuchemos nuevamente a Freeman J. Dyson: Para edificar su teoría, Einstein recurrió a la geometría no euclidiana, una geometría sobre espacios curvos que fue inventada en el siglo diecinueve. Einstein dio un paso inusitado al identificar nuestro espacio-tiempo real con un espacio curvo no euclidiano, de modo que las leyes de la física se convirtieron en proposiciones de una geometría radicalmente diferente de la geometría clásica del espacio plano. Esto lo hizo con base en argumentos de carácter general y juicios estéticos. Las pruebas de la teoría basadas en la observación no se llevaron a cabo sino tiempo después de su construcción y no jugaron ningún papel en el proceso creativo. Einstein mismo parece haber confiado tanto en su intuición matemática que jamás se inquietó respecto al resultado de las observaciones. Por supuesto, los resultados positivos de las mismas fueron un paso decisivo para convencer a los físicos que tenía razón.23 22 Dyson, 1964, p. 134. El último comentario es significativo: los “modelos mecánicos o dinámicos” a que se refiere el autor son representaciones como la del “sistema planetario” para el átomo, que no tienen ningún fundamento. Así, los objetos de la física también devinieron entes abstractos, de carácter matemático. 23 Op. cit, p. 131. 2.4. L A FÍSICA CUÁNTICA Y LA TEORÍA DE GRUPOS 109 Ciertamente, la teoría de la relatividad es, como dice Dyson, “el primer ejemplo de una teoría física construida sobre un ‘salto matemático en la oscuridad.’”24 El segundo lo fue la mecánica cuántica, que también parte de un “salto especulativo de la imaginación matemática, el cual se ve con mayor claridad en el trabajo de Schrödinger.”25 En efecto, para adoptar tales teorías matemáticas no se contaba en principio con ninguna evidencia empírica. Éste fue el estado de cosas al que se llegó tras la expansión y liberación de la matemática, y éstas las ganancias que produjo en otras áreas del conocimiento,26 lo que de suyo nos lleva a una pregunta que, si bien rebasa el marco de esta obra, es ilustrativa del impacto de la matemática moderna en la ciencia: ¿cuál es el papel de la matemática en la formación del objeto de estudio en áreas como la física? Junto a ésta, surge de inmediato la interrogante que nos hemos planteado desde el inicio de esta obra: ¿qué garantía racional tenemos de que la matemática, ahora indisolublemente entrelazada con las teorías físicas, no habrá de llevarlas por una senda equivocada? ¿Cómo estar seguros de que el cuadro de los fenómenos que nos proporciona una teoría física forma un todo consistente? En cuanto al aparato matemático utilizado, habría que garantizar que éste no puede ser la fuente de tales estigmas. Ésta fue una segunda razón para que Hilbert insistiera en el problema de los fundamentos de la matemática y en la necesidad de dar una prueba de consistencia de sus más importantes teorías. Los ejemplos recién mencionados no son un caso aislado y bastan por sí mismos para justificar la defensa que hiciera Hilbert de la matemática pura, aduciendo que ésta a la larga produce resultados inesperados en otras áreas del conocimiento, como si se tratara de una ciencia cuya función fuera la de elaborar moldes abstractos o, como lo dice Hilbert en la carta a Frege, ya citada en la sección 1.6.1.1, andamiajes de conceptos que sólo más tarde se podrán llenar con algún contenido específico en el marco de otra disciplina.27 Parece también plenamente justificado el punto de vista 24 Ibid. 25 Ibid. 26 Un último ejemplo que no queremos dejar de mencionar es el de los espacios de Hilbert y su uso en la mecánica cuántica. Se trata de un caso en el que una teoría matemática, fruto del movimiento interno de esta disciplina, ofreció el simbolismo adecuado para desarrollar una teoría, no de números o cantidades, sino de “estados”. Los espacios de Hilbert se obtienen al generalizar la geometría de Euclides a espacios de dimensión infinita. En dichos espacios los puntos son sucesiones infinitas x1 , x2 , . . . , xn , . . . de números con la propiedad de que la serie de sus cuadrados es convergente. Para la mecánica cuántica estos objetos fueron la clave para precisar la idea de “estado cuántico”, y con ellos se pudo edificar una rigurosa teoría en la que se procede lógicamente a partir de axiomas claramente definidos. 27 En 1930 Hilbert puso como ejemplo el estudio de las secciones cónicas, cuyas propiedades fueron investigadas desde la antigüedad sin sospechar que nuestros planetas se mueven siguiendo su curso. Hilbert incluso llega a hablar de una armonía preestablecida entre el pensamiento y la realidad, a lo que añade: “Recientemente se han presentado algunos casos en los que los más importantes teoremas matemáticos, aquellos que se encuentran en el centro de la atención de los investigadores, son al mismo tiempo los que la física necesita. Yo he desarrollado una teoría de una infinidad de variables a partir de un interés puramente matemático, e incluso he utilizado el término análisis espectral, sin sospechar que un día se realizaría en el espectro actual de la física.”. [Hilbert, 1930, cita tomada de la traducción al inglés, p. 1160]. Aquí reaparece la idea de que los matemáticos son sastres, que confeccionan trajes que algún 110 2. L A MATEMÁTICA MODERNA Y LA TEORÍA DE CONJUNTOS según el cual las matemáticas obedecen a un doble movimiento, uno interno que da lugar a sus propios problemas y teorías, y otro externo, que las convierte en un factor esencial en la comprensión y dominio de la naturaleza. Así, además de un crecimiento sin precedente, la matemática del siglo diecinueve experimentó también un cambio en los métodos utilizados, los fines perseguidos y la adopción de un espíritu crítico que llevó a una revisión de sus fundamentos.28 La acción de estos tres factores fue determinante en la constitución de una nueva matemática que gusta de la forma y la estructura, frente a la matemática tradicional que prefiere operar con la intuición y en contacto directo con contenidos específicos.29 2.5. La aritmetización del análisis El desarrollo de la matemática ha obligado en ciertos momentos a reconsiderar el sistema de ideas y creencias que hasta entonces se habían aceptado como justificación y fundamento de la misma. Dichos momentos se han caracterizado por la aparición de dificultades y anomalías difícilmente manejables o explicables a partir de las creencias y los principios admitidos. Fruto de tales situaciones ha sido la necesidad de revisar los fundamentos de todas o algunas de sus partes, complementando de este modo el trabajo matemático con un examen minucioso de las ideas centrales en torno a las cuales se desarrollan sus teorías. La primera dificultad en este sentido se relaciona con el descubrimiento de magnitudes inconmensurables en la antigua Grecia. Esto echó por tierra la posibilidad de que la geometría (ciencia de lo continuo) y la aritmética (ciencia de lo discreto) coexistieran en una sola teoría, con un cierto dominio de la segunda sobre la primera. día será utilizados por imprevistos usuarios. 28 Ahí están como ejemplo la teoría de los números, el análisis matemático, la teoría de Galois, las teoría de la convergencia de series, la teoría de funciones, la teoría analítica del calor, las series de Fourier, las ecuaciones diferenciales parciales, las funciones elípticas, el cálculo de variaciones, el álgebra de matrices, la geometría diferencial, la geometría proyectiva y la teoría de conjuntos de Cantor, que por sí mismas hablan de un desarrollo sin paralelo en esta ciencia. A lo anterior habría que añadir las llamadas pruebas de imposibilidad, una de las cuales establece la imposibilidad de deducir el quinto postulado de los otros cuatro, o las pruebas de imposibilidad de los tres problemas clásicos (duplicar el cubo, trisecar el ángulo o cuadrar el círculo con regla y compás) y la imposibilidad de resolver cualquier ecuación de grado mayor al cuarto por medio de radicales. Estas pruebas fueron las primeras en su género, y a ellas se habrían de unir las ideadas, entre otros, por Cantor, Gödel, Church, Tarski, Turing y Matiyasevich en el siglo veinte. 29 En este punto se presenta un hecho paradójico: por una parte, es muy fácil distinguir la matemática moderna de la tradicional, y por la otra es muy difícil trazar una clara demarcación entre ambas, sobre todo si tomamos en cuenta que se trata de una ciencia que nada desecha. Así, por ejemplo, las nuevas geometrías no anularon a la euclidiana, ni las nuevas teorías algebraicas echaron al olvido al álgebra tradicional. Cuando una teoría se generaliza o se modifica, no por ello se le rechaza: nada de lo nuevo excluye a lo viejo, sólo lo pone en perspectiva, enriqueciendo nuestro punto de vista. En todo caso, la diferencia habría que buscarla en el modo de pensar los objetos y en la búsqueda de la estructura subyacente en cada caso. 2.5. L A ARITMETIZACIÓN DEL ANÁLISIS 111 En efecto, si bien nada se sabe directamente de los Pitagóricos, todo parece indicar que al centro de su filosofía se hallaba la tesis de que los números son el principio de todas las cosas.30 Entre otras cosas, esto tendría como consecuencia el que todas las magnitudes de una misma especie se pudieran comparar o medir utilizando los números enteros. No obstante, al desarrollar el programa basado en esta idea, los pitagóricos se encontraron con el problema de comparar el lado de un cuadrado con la diagonal del mismo. Pronto llegaron a una conclusión que no tenía cabida en su concepción de la matemática: el lado del cuadrado y su diagonal no son conmensurables (no tienen una medida común, no se pueden expresar como múltiplos de una misma unidad), lo cual, √ en lenguaje moderno, se expresa diciendo que 2 es irracional, es decir, que no se puede expresar como un cociente de la forma p/q donde p y q son números enteros. Debido a este descubrimiento, la doctrina de la conmensurabilidad y la idea misma de que “todas las cosas están hechas de números” fue abandonada, al igual que el estudio de la aritmética sin el recurso de la geometría. Esto tuvo grandes consecuencias con relación a los fundamentos de la geometría y el modo de cultivarla. El siglo diecinueve afrontó nuevas dificultades con relación a los fundamentos de la matemática, esta vez ocasionadas en parte por la aparición de resultados paradójicos en el análisis matemático (teoría que comprendía al cálculo diferencial e integral, las ecuaciones diferenciales y la variable compleja), y en parte por el tratamiento poco riguroso que hasta entonces se le había dado a sus conceptos. En efecto, el desarrollo del análisis durante el siglo dieciocho se apoyó en gran medida sobre profundas intuiciones que permitieron resolver con acierto la mayor parte de los problemas planteados. Sin embargo, el rigor deductivo fue dejado de lado en muchos casos; en su lugar se colocó a la intuición, principalmente la geométrica. La existencia de un ente matemático, en vez de ser deducida, se vislumbraba, supliéndose el rigor con certeras intuiciones relativas a los objetos matemáticos. Consecuencia de ello fue que no tardaron en aparecer las dificultades y las críticas: los conceptos básicos (por ejemplo el de función) eran poco claros y con frecuencia ligados a representaciones geométricas o físicas. En el caso de las series, la falta de rigor y la ausencia de criterios de convergencia dio lugar a absurdos para las cuales no se tenía una solución. Incluso se llegaron a obtener “resultados” que al poco tiempo probaron ser falsos. Por ejemplo, André-Marie Ampère (1775-1836) “demostró” que una curva tiene tangente en todos sus puntos, con la posible excepción de algunos de ellos en forma aislada, 30 Por ejemplo, en su Vida de Pitágoras Porfirio (s. III d. C.) le atribuye la tesis de que “[. . . ] la naturaleza universal se circunscribe en las razones y proporciones numéricas y todo lo engendrado se regula, en su crecimiento y perfección, de acuerdo con unas razones numéricas.” (Porfirio, 1987, p. 54) Un claro ejemplo de ello es la exposición que aparentemente hiciera Pitágoras de la escala musical de 7 notas mediante simples relaciones numéricas. Por ejemplo, si una cuerda de longitud 1 está afinada en “do”, entonces los siguientes cocientes marcan las fracciones de la cuerda (v. gr., puntos de presión en el brazo de una guitarra) que producen los sonidos de la escala ascendente do-re-mi-fa-sol-la-si-do: 1, 243/256, 27/32, 3/4, 4/6, 81/128, 9/16, 1/2. Al respecto, el lector puede consultar la página http://www.sacred-geometry. es/?q=es/content/proporci\%C3\%B3n-en-las-escalas-musicales\#3.1 112 2. L A MATEMÁTICA MODERNA Y LA TEORÍA DE CONJUNTOS conclusión que marcha acorde con los dictados de la intuición. La sorpresa fue general cuando, tiempo después, Karl Weierstrass (1815-1897) anunció, como ya lo hemos mencionado, la existencia de una curva continua pero sin tangente en ninguno de sus puntos. Estos desarrollos trajeron consigo un cambio en el concepto de función, una de las nociones centrales de la matemática moderna. Ante tales dificultades algunos matemáticos decidieron poner “orden en el caos”: era indispensable volver al rigor en una matemática mucho más desarrollada y compleja que la que enfrentara Euclides. En un principio la tarea consistió en proporcionar criterios que permitieran tratar con un máximo de rigor nociones tales como las de función, convergencia, continuidad y diferenciación, a fin de liberar al análisis de su dependencia de nociones geométricas, de la idea de movimiento, de los números infinitamente pequeños (infinitesimales) y de todo tipo de consideraciones intuitivas en las demostraciones. He aquí cómo se expresa Richard Dedekind al respecto (a esta cuestión ya nos hemos referido en la sección 1.4 en otro sentido): Como profesor de la Escuela Politécnica de Zurich y ante la exigencia de enseñar los métodos del cálculo diferencial e integral, sentí más que nunca la necesidad de un fundamento verdaderamente científico para la aritmética. Al discutir la noción de “aproximación” de una magnitud variable a un valor límite fijo y al probar el teorema que establece que toda magnitud creciente, continua y acotada se aproxima a un límite, he tenido que apelar a la evidencia geométrica. Dicho recurso a la evidencia me parece útil desde un punto de vista didáctico, e incluso indispensable si no se desea perder tiempo. Sin embargo, esta forma de introducirse al cálculo no se puede decir que sea científica, nadie lo negará. Este sentimiento de insatisfacción era tan grande en mí que tomé la determinación de meditar en el problema hasta encontrar un riguroso fundamento para los principios del análisis infinitesimal. Se dice con frecuencia que el cálculo trata con las magnitudes continuas y aún no se ha encontrado una explicación a la continuidad. Incluso la más rigurosa exposición del cálculo diferencial no basa sus demostraciones en la noción de continuidad, sino que apela, con vaga conciencia de ello, o bien a nociones geométricas (o aquellas que sugiere la geometría), o bien a teoremas que no se han demostrado de un modo puramente aritmético.31 La definición de nociones como las de “convergencia”, “derivada”, “continuidad” o “límite” sobre la sola base de la aritmética fue obra de matemáticos como Bolzano, Riemann, Cauchy y Weierstrass que suministraron una sólida base para el análisis. No obstante, La definición exacta de tales nociones no marcó el fin de las investigaciones en torno al fundamento del análisis (en el sentido ya mencionado en la sección 1.5.1), ya que prácticamente todo el trabajo efectuado presuponía el conocimiento de los números reales, cuya propiedades básicas aún no se habían establecido.32 Al hacerlo, fue posible 31 Dedekind, 32 En 1963, p. 12. efecto, es un hecho histórico que los principios del sistema de los números reales no fueron 2.5. L A ARITMETIZACIÓN DEL ANÁLISIS 113 definir el continuo numérico mediante una compleja reducción de este sistema al de los números naturales junto con algunas nociones de la teoría de conjuntos, y fue a partir de ello que se lograron establecer las propiedades básicas de los números reales (véanse, por ejemplo, los axiomas V.2 de Hilbert para la geometría y V’.1 de Dedekind en el inciso (6) del apéndice C). Es por ello que a la fase final de la instauración del rigor en el análisis se le llama aritmetización del análisis. En este sentido, el trabajo de Dedekind en “Continuidad y números irracionales” (“Stetigkeit und Irrationale Zahlen”) de 1872 es una continuación de la labor de, entre otros, Cauchy y Weierstrass, en la que no se había establecido un verdadero puente entre los números (enteros, racionales) y las magnitudes o cantidades continuas. De hecho, la consideración de estas últimas remitía invariablemente a la geometría, donde eran entendidas como líneas, áreas, ángulos, etc. y/o proporciones acerca de ellas (v. gr., razones y proporciones entre segmentos, figuras y volúmenes). Se tenía entonces una distinción que se quería borrar: la matemática era, por una parte, la ciencia del número (aritmética) y, por la otra, la ciencia de la magnitud (geometría). En otras palabras, uno de los propósitos de Dedekind era expresar las relaciones, razones y proporciones entre magnitudes mediante números, es decir, mediante la introducción de un sistema numérico conveniente. Lo que hizo entonces fue asociar a cada segmento un “número”, es decir, una entidad numérica que expresara su magnitud (su “longitud”). Esto no lo tuvieron los griegos, pues para ellos lo que había eran magnitudes geométricas (v. gr., la diagonal de un cuadrado) para las que, precisamente, no había números que las expresaran (es decir, entidades numéricas que pudieran sumarse, multiplicarse, etc. como los demás números). El reto no era sencillo: se quería un sistema en el que estuvieran presentes los números discretos (1, 2, 3,. . . ) y otros números que expresaran todas las razones y proporciones entre magnitudes y cantidades continuas, un sistema en el que todas las entidades obedecieran las mismas leyes aritméticas (para mayores detalles, véase (Reck, 2016)). En cuanto a los distintos sentidos que le hemos dado a la idea de “fundamentación” en la sección 1.5.1, queremos señalar que la labor de Dedekind tuvo un doble significado: por una parte, consistió en concebir las magnitudes irracionales como números (logrando de esta manera un tratamiento unificado junto con los números racionales); por la otra, consistió en independizar el análisis de la mecánica (v. gr., de la consideración del movimiento), de la geometría y, en general, de toda consideración intuitiva, tal como lo afirma en el párrafo antes citado. Podemos decir que la idea que tenía Dedekind acerca de lo que era “fundamentar el análisis” incluía los tres aspectos ya mencionados en la sección 1.5.1. Volviendo a la matemática misma, podemos decir que la aritmetización del análisis cumplió su cometido en dos sentidos: en primer lugar, liberó al análisis de la intuición geométrica; en segundo lugar, logró reducir las nociones básicas del análisis a las de establecidos sino hasta la segunda mitad del siglo diecinueve. Hasta entonces, ni aun las más simples propiedades de los números racionales e irracionales se habían demostrado, ni los números reales se habían definido. 114 2. L A MATEMÁTICA MODERNA Y LA TEORÍA DE CONJUNTOS número entero y conjunto infinito de números racionales. Lo insatisfactorio de esta reducción es que no se logró sobre la sola base de la aritmética, sino de la aritmética junto con diversas nociones propias de la teoría de conjuntos, pues para establecer el sistema de los números reales Dedekind debió introducir la totalidad de los números racionales y conjuntos infinitos de estos. Esto último constituye, obviamente, una imperfección, pues reintroduce la noción de infinito ahí donde con muchos esfuerzos se le había intentado desterrar. Aquí el problema es que la fundamentación de la teoría de los conjuntos probó a la larga ser extremadamente difícil, como más adelante veremos. En cuanto al problema de investigar la consistencia de los axiomas de la aritmética, Hilbert tenía ahora una segunda razón para insistir en su importancia, pues el fundamento del análisis clásico, en uno de los sentidos ya señalados en la sección 1.5.1, dependía de su solución favorable. 2.6. La teoría de los números transfinitos de Cantor Hacia 1870 los progresos alcanzados en la fundamentación del análisis y la influencia de matemáticos como Gauss, Weierstrass y Leopold Kronecker lograron imponer una concepción taxativa del infinito en la que éste sólo se admitía como algo potencial. El infinito, en el sentido estricto de la palabra, fue desterrado de la matemática y sólo subsistía como una forma de hablar. No obstante, su exclusión no duró mucho tiempo. Poco después, Richard Dedekind y Georg Cantor (1845-1916) resucitaron la quimera del infinito, esta vez en la más abominada de sus formas: el infinito actual. El primero lo hizo en su definición de los números reales; el segundo, creando una hermosa teoría, la de los números transfinitos, calificada por Hilbert como un paraíso.33 La teoría de conjuntos de Cantor es una teoría abstracta, sin ningún sentido práctico y desarrollada por sí misma, libre de la obligación de pensar en “este mundo”.34 Se trata, sin lugar a dudas, de la mejor exponente de esa nueva actitud ante el quehacer matemático en la que la realidad física, el mundo empírico y multitud de cosas más se dejan de lado.35 No obstante, en lo que parece ser una paradoja, con el paso del tiempo sus métodos y conceptos conquistaron prácticamente todas las áreas de la matemática, dotándolas de un lenguaje común, enlazándolas por distantes que parecieran. Podemos 33 A Cantor no le tomó mucho tiempo realizar su obra: en sólo una década, de 1874 a 1884, fijó los conceptos y resultados básicos de esta disciplina. 34 Las nociones fundamentales de la teoría de conjuntos son las de conjunto y pertenencia a un conjunto, que bien a bien no se pueden definir. Cantor se refiere a ellas con las siguientes palabras:“Por un conjunto [Menge] hemos de entender cualquier reunión en un todo [Zusammenfassung zu einem Ganzen] M de objetos definidos y distintos de nuestra intuición o nuestro pensamiento. Estos objetos son llamados elementos de M.” [Cantor 1955, p. 85.] Esta definición muestra la naturaleza conceptual de los conjuntos, constituidos por objetos del pensamiento o la intuición, no por entes materiales. 35 Dave Rusin expresa esta idea con sumo ingenio y regocijo cuando dice que “la matemática es la parte de la ciencia que usted podría continuar haciendo si al despertar el día de mañana descubriera que el universo se ha ido.” 2.6. L A TEORÍA DE LOS NÚMEROS TRANSFINITOS DE C ANTOR 115 decir que toda la matemática moderna ha sentido su presencia y que incluso las más antiguas aritmética y geometría se han podido reconstruir al interior de ella sin ninguna dificultad.36 No es nuestro propósito examinar con detenimiento esta teoría, cuyo conocimiento se adquiere sólo con muchas horas de estudio. En vez de ello nos conformaremos con entreabrir la puerta para contemplar algunos de sus paisajes. La presentación será por necesidad poco rigurosa, exageradamente simplificada y sin ninguna pretensión de completud. Se hará tomando en cuenta cuatro objetivos: (i) señalar algunos aspectos de la teoría matemática sobre el infinito; (ii) mostrar su relación con la matemática moderna; (iii) presentar el método de la diagonal de Cantor (del que se sirven la paradoja de Richard y el primer teorema de Gödel); y (iv) exponer la hipótesis del continuo, a la que habremos de volver reiteradamente37 y que Hilbert inscribiera en su famosa lista de 1900 como primer problema. Con ello esperamos que el lector se forme una idea de las delicadas especulaciones matemáticas que comprende esta teoría y disponga de los elementos necesarios para seguir con cierto detalle la prueba del primer teorema de incompletud de Gödel. 2.6.1. El concepto de infinito en la teoría de conjuntos El infinito de la teoría de conjuntos no es el del tiempo o el espacio, y sus problemas no son los de su existencia material. Tampoco es la infinitud divina de las Meditaciones metafísicas de Descartes, o la infinitud del Universo de Giordano Bruno. El infinito de Cantor y Dedekind no es metafísico; es una idea, una noción matemática que en poco o nada se relaciona con las anteriores y que no tiene la necesidad de ser representada o realizada. Tampoco es el infinito en potencia de Aristóteles, Occam, Kronecker o Weierstrass, que se puede recorrer pero nunca exhaustivamente, o se puede aumentar cuanto se quiera (mediante adiciones finitas) sin nunca llegar a su fin. Es el infinito categórico, actual, en acto, que se trata como una especie particular de magnitud y que se expresa a través de las nociones de número cardinal y número ordinal.38 En la obra de Dedekind el infinito actual se presenta en la construcción de los números irracionales que, como Cantor demuestra, no se pueden definir mediante sucesiones 36 Podemos decir también que la aritmetización del análisis fue factible gracias a nociones tomadas de ella, y que sus métodos y conceptos hicieron posible la teoría de los números trascendentes, la teoría de funciones de una variable real, el desarrollo de funciones en series trigonométricas de Fourier, la teoría de los espacios abstractos, el álgebra moderna, la topología (una de cuyas ramas se denomina topología de conjuntos), el cálculo de probabilidades y la estadística. 37 Esto sucederá en este apartado, en la sección 2.6.4, en el apéndice F (hipótesis generalizada del continuo), en la sección 4.1.1, etc. 38 Hasta poco antes de 1874 la noción de infinito en matemáticas era relativamente imprecisa y aunque muchos de sus objetos lo eran en número como, por ejemplo, los enteros positivos o los puntos de un segmento, los matemáticos no hicieron distinción alguna entre ellos. El infinito era simplemente el infinito y no era susceptible de ninguna otra determinación. Esta situación cambió radicalmente con la intervención de Cantor, que no sólo lo jerarquizó, sino que incluso definió una peculiar aritmética de conjuntos infinitos que aquí mencionaremos someramente. 116 2. L A MATEMÁTICA MODERNA Y LA TEORÍA DE CONJUNTOS finitas de números racionales. La construcción tiene como base intuitiva la identificación de los números racionales con puntos de la recta y el siguiente principio de continuidad: Si los puntos de la línea recta se dividen en dos clases de modo que todo punto de la primera clase se halle a la izquierda de todo punto de la segunda clase, entonces existe uno y sólo un punto que produce esta división de los puntos en dos clases, esta separación de la línea recta en dos porciones.39 Esta división induce una partición de los números racionales en dos clases, según correspondan a puntos de la primera o de la segunda clase. A éstas se les llama cortaduras de Dedekind y se les identifica con el punto de la recta que, según el principio, produce la división. Un número real no es otra cosa que una cortadura, lográndose de este modo la identificación de los puntos de la recta con ciertos conjuntos de números. De lo anterior resulta que la única manera de definir a los números reales a partir de los números racionales es recurriendo a conjuntos infinitos de estos últimos, los cuales se manipulan como si fueran finitos, realizando con ellos operaciones como la suma y el producto. En otras palabras, en la teoría de Dedekind hay un uso operativo del infinito actual. En cuanto a Cantor, de cuya teoría nos ocuparemos principalmente, sus intereses lo llevaron en otra dirección. Sus investigaciones tuvieron como punto de partida la teoría de funciones de una variable real, algunos de cuyos problemas implicaban distinguir un número finito o infinito de puntos “excepcionales” como, por ejemplo, puntos de discontinuidad. En este sentido, en sus primeros años Cantor sólo se interesó en conjuntos que se pudieran contar utilizando índices, una idea distinta a la de desarrollar una teoría de magnitudes infinitamente grandes.40 Hoy en día la teoría de conjuntos es un campo de investigación muy extenso que no habremos de reseñar. Al respecto sólo haremos referencia a resultados conocidos por Cantor y Dedekind, aunque expresados en un lenguaje moderno. En particular, iremos directamente a las cuestiones de nuestro interés, comentando si acaso los problemas específicos en que se originaron. Para no hacer demasiado extensa la exposición, en 39 Dedekind, 1963, p. 11. Se trata de la misma noción que se expresa en el axioma V’.1 del apéndice C. Lavine sostiene que la principal preocupación de Cantor entre 1874 y 1890 fue la de extender los métodos de conteo de colecciones finitas a colecciones infinitas, por lo que la necesidad de incluir en la teoría al conjunto de los números reales le ocasionó cierto malestar, pues este conjunto no se podía “contar” en el sentido recién señalado (Cf. Lavine, 1994, pp. 1-10). Así, para acceder a los números reales Cantor debió introducir su versión de lo que ahora se conoce como axioma del conjunto potencia, el cual establece que los subconjuntos de un conjunto dado forman a su vez un conjunto. El problema que este principio planteaba era que no se tenía idea de cómo contar las nuevas colecciones a las que daba lugar. Tales dificultades se relacionan con el axioma de elección y el principio del buen orden que Zermelo habría de introducir más adelante para coronar la teoría cantoriana. Para mayores detalles el lector podrá consultar además del texto de Lavine, la bibliografía de Cantor y los siguientes textos, que tratan en extenso con estos y otros aspectos de la teoría cantoriana: Dauben, 1979; Fraenkel, 1976 y Wang, 1993. 40 Shaughan 2.6. L A TEORÍA DE LOS NÚMEROS TRANSFINITOS DE C ANTOR 117 el apéndice F el lector hallará una presentación más detallada de la teoría y algunos temas que no figuran en esta sección. Su lectura la consideramos imprescindible para quien esté poco familiarizado con el tema, tomando en cuenta que en lo que sigue supondremos conocidos algunos conceptos y nociones ahí expuestas.41 2.6.2. Conjuntos, funciones, relaciones y estructuras abstractas Cantor y Dedekind fueron los primeros en estudiar de manera sistemática los conjuntos infinitos. No obstante, su propósito no era el mismo. Dedekind se interesó más que nada en las operaciones con conjuntos y en la relación entre los conceptos de número natural y conjunto infinito. En su libro Was sind und was sollen die Zahlen? (¿Qué son y qué han sido los números?) de 1888 probó, sin suponer la existencia de los números naturales, que todo conjunto infinito A contiene necesariamente un subconjunto N ∗ que es una “copia” de los números naturales (de ahí la notación) y cuyos elementos satisfacen los axiomas ahora llamados “de Peano”, establecidos en este texto por primera vez.42 Fue en dicha obra donde introdujo el lenguaje de los conjuntos casi como se le utiliza hoy en día y definió las operaciones de unión e intersección de conjuntos, señalando que éstas pueden ser aplicadas a cualquier familia de subconjuntos de un conjunto dado. Asimismo, observó que los subconjuntos de un conjunto A forman a su vez un conjunto, que ahora denotamos con ℘(A). Algo novedoso y que habría de tener un notable efecto en toda la matemática fue la generalización del concepto de función o mapeo. Dedekind, en vez de restringirse como hasta entonces se había hecho a funciones de números reales o complejos, generalizó el concepto casi al máximo: dados dos conjuntos A y B, una función f de A en B es una ley (gesetz) que asocia a cada elemento a de A un único elemento b de B denominado su valor en a y denotado con f (a).43 La única noción que se halla ausente en la exposición de Dedekind y que es muy utilizada hoy en día es la de producto cartesiano A × B de dos conjuntos. Fue Cantor quien la introdujo. Se trata del conjunto de parejas ordenadas (a, b) que se pueden formar con los elementos de A y de B, una generalización del concepto de coordenadas cartesianas. Esta noción se relaciona con el concepto de función como sigue: si f : A → B es una función, entonces la gráfica G f de f es el subconjunto de A × B formado por todas las parejas de la forma (a, f (a)), donde a es un elemento de A. En 41 Estas nociones son principalmente las de correspondencia uno a uno (biyectiva), número cardinal y número ordinal. 42 Axiomas de Peano: (1) 0 es un número natural. (2) Todo número natural n tiene un sucesor sn. (3) Dos números naturales con sucesores iguales son iguales entre sí. (4) 0 no es sucesor de ningún número natural. (5) Un conjunto X que contiene a 0 y que contiene a sn toda vez que contiene a n, contiene a todos los números naturales (principio de inducción). 43 Actualmente se han adoptado distintas notaciones para denotar funciones, como, por ejemplo, x → f (x) que evita la introducción de nuevos símbolos (como cuando se escribe x → x2 ) o la más compleja f : A → B para indicar el conjunto A en que se define la función y el conjunto B en que toma sus valores. 118 2. L A MATEMÁTICA MODERNA Y LA TEORÍA DE CONJUNTOS forma análoga se puede definir el producto cartesiano A1 × A2 × . . . × An de n conjuntos cualesquiera. Con base en el concepto de producto cartesiano es posible definir el concepto de relación de A en B: una relación de A en B es un subconjunto del producto cartesiano A × B, con lo que las funciones pasan a ser un caso particular de relaciones. La importancia de estas nociones es que permiten hablar de funciones y operaciones entre objetos de naturaleza indeterminada, que no necesariamente son números. De este modo los matemáticos de fines del siglo diecinueve y del siglo veinte pudieron hacer referencia a estructuras abstractas, es decir, a sistemas de objetos acerca de los cuales lo único que se sabe es que satisfacen ciertas relaciones que se “definen” mediante axiomas, tal como lo hiciera Hilbert en el caso de la geometría (aunque él no se sirve de la noción de función). 2.6.3. Los comienzos de la teoría cantoriana: conjuntos de números Cantor comenzó estudiando los conjuntos de números más importantes del continuo numérico: los números naturales, los números racionales y los números reales. Buscó las diferencias entre ellos en el sentido de que los primeros forman un conjunto discreto (para cada número siempre hay “el siguiente”), el segundo es un conjunto denso pero no continuo (los hay por doquier, pero presentan “huecos” en la recta numérica), y el tercero forma un continuo. En 1874 publicó un artículo en el que demuestra el notable resultado de que los números racionales y los números algebraicos se pueden poner en correspondencia uno a uno (1-1) con los números naturales, mientras que los números reales no (es decir, no se puede “cubrir” o igualar con los anteriores). Con ello puso en evidencia que hay conjuntos infinitos de distintas magnitudes, y demostró el hecho sorprendente de que los conjuntos de números naturales, racionales y algebraicos tienen la misma magnitud. La demostración de estos resultados se puede llevar a cabo sirviéndose de dos procedimientos de su invención: el método de las matrices infinitas y el método de la diagonal. Veamos cada uno de ellos.44 Matrices infinitas. La enumeración de los números racionales se puede llevar a cabo con base en el siguiente procedimiento. Dispóngase las fracciones positivas en un arreglo bidimensional (en una matriz infinita) como en el primero de los siguientes diagramas: 44 Si el lector tiene dificultades en el manejo de nociones como las de conjunto infinito, potencia de un conjunto, numerabilidad, enumeración de un conjunto, etc. o no conoce su definición precisa, le sugerimos que lea el apéndice F, de preferencia con lápiz y papel a la mano; en él se introducen dichas nociones y se ofrecen algunos ejemplos sencillos. 2.6. L A TEORÍA DE LOS NÚMEROS TRANSFINITOS DE C ANTOR 119 En el diagrama a la derecha se muestra cómo enumerar las fracciones positivas siguiendo las flechas: 1/1, 2/1, 1/2, 1/3, 2/2, 3/1, 4/1, 3/2, 2/3, 1/4, 1/5, . . . Si se eliminan aquellas fracciones que son iguales en valor numérico a alguna precedente y se intercalan los inversos aditivos, el resultado es una enumeración de los números racionales: 1, −1; 2, −2; 1/2, −1/2; 1/3, −1/3; 3, −3; 4, −4; 3/2, −3/2; 2/3, −2/3; 1/4, −1/4... Aplicando el mismo procedimiento se puede demostrar la numerabilidad de diversos conjuntos. Los siguientes son algunos ejemplos: 1. El conjunto de pares ordenados de números naturales. 2. El conjunto de pares ordenados de números racionales. 3. El conjunto de ternas ordenadas de números naturales. 4. El conjunto Sn de sucesiones finitas de n números naturales, para cada n fija. 5. El conjunto S de sucesiones finitas de números naturales y el conjunto T de sucesiones finitas de números racionales. 6. El conjunto de ecuaciones algebraicas, es decir, de ecuaciones de la forma an xn + an−1 xn−1 + . . . + a1 x + a0 = 0 donde los coeficientes an , an−1 , . . . , a0 son números enteros y an = 0. 7. El conjunto de números algebraicos, es decir, de números que son raíz de una ecuación algebraica. (Esto se debe al hecho de que toda ecuación algebraica de grado n tiene a lo más n raíces distintas, entre las que pueden figurar números complejos). 8. El conjunto de expresiones de un lenguaje L con alfabeto A, donde A es un conjunto finito o numerable (una expresión es una sucesión finita de símbolos de A).45 45 Aunque estos resultados no dejan de ser sorprendentes, la noción de infinito considerada hasta aquí es 120 2. L A MATEMÁTICA MODERNA Y LA TEORÍA DE CONJUNTOS El método de la diagonal. En el mismo escrito en que Cantor demuestra la numerabilidad de los números algebraicos se encuentra la demostración de que hay conjuntos infinitos que no se pueden poner en correspondencia uno a uno con los números naturales N o, como se suele decir, que no tienen la misma potencia que N. Si bien el camino que ahí sigue es un tanto difícil de andar, en 1891 propuso un nuevo procedimiento de prueba que ahora se conoce como método de la diagonal, y que nosotros expondremos con relación a un subconjunto de los números reales. Este método ha sido utilizado con mucho éxito en distintas áreas de la matemática moderna para demostrar “imposibilidades”. Consideremos el conjunto de los números reales en el intervalo 0 < x < 1. Cada número perteneciente a él está representado por una fracción decimal infinita de la forma 0.d1 d2 d3 . . . donde cada dn es alguno de los dígitos 0, 1, 2, 3, 4, 5, 6, 7, 8 ó 9.46 Por ejemplo, 0.235757 . . . sería uno de ellos (donde la expresión 57 indica que la sucesión “57” se repite indefinidamente, en cuyo caso se dice que el decimal es periódico). Supongamos ahora que se han enumerado algunos números reales del intervalo 0 < x < 1, es decir, que se han puesto en correspondencia uno a uno con el conjunto de los números naturales. En tal caso se podría formar una lista como la siguiente: 1. 0.d11 d12 d13 d14 . . . d1n . . . 2. 0.d21 d22 d23 d24 . . . d2n . . . 3. 0.d31 d32 d33 d34 . . . d3n . . . 4. 0.d41 d42 d43 d44 . . . d4n . . . ... ... 0.d11 d12 d13 d14 . . . d1n . . . 0.d21 d22 d23 d24 . . . d2n . . . 0.d31 d32 d33 d34 . . . d3n . . . 0.d41 d42 d43 d44 . . . d4n . . . ... Ahora elaboremos una fracción decimal con los dígitos sobre la diagonal del arreglo (marcada por las flechas en la segunda figura): 0.d11 d22 d33 d44 . . . y formemos una segunda fracción decimal 0.a1 a2 a3 a4 . . . definiendo, para cada índice n, an = 1 si dnn = 1 y an = 2 si dnn = 1. Esta nueva fracción difiere de la primera en la lista en el lugar de la décimas (en el primer dígito después del punto decimal), de la segunda en el lugar de la centésimas (en el segundo dígito después del punto decimal) y, en general, de la enésima fracción en el enésimo dígito, por lo que la fracción 0.a1 a2 a3 a4 . . . no la del infinito potencial, pues cualquier proceso de enumeración lo único que presupone es la posibilidad de seguir construyendo la lista sin abandonar el dominio de lo finito. En cuanto al infinito actual, éste hará acto de presencia al considerar otro tipo de conjuntos, como a continuación veremos. 46 Nótese que no todos los dígitos son 0. Por otra parte, para que el resultado sea válido debemos prohibir que el dígito 9 figure en la sucesión un número infinito de veces consecutivas, es decir, debemos evitar las sucesiones de la forma 0.d1 d2 d3 . . . 999 . . . Esto se debe a que fracciones como, 0.019999... y 0.020000... representan un mismo número. 2.6. L A TEORÍA DE LOS NÚMEROS TRANSFINITOS DE C ANTOR 121 figura en la lista (de lo contrario tendría que diferir de sí misma en algún dígito). Por tanto, ninguna enumeración de números reales del intervalo (0, 1), tal como se planteó al principio, los incluye a todos ellos y el conjunto no es numerable. En otras palabras, la potencia del intervalo (0, 1) es distinta de la de N. Con base en este resultado es posible demostrar la no numerabilidad del conjunto R de los números reales. Para ello es suficiente con establecer una correspondencia uno a uno (una biyección) entre R y el intervalo (0, 1). Un ejemplo es el siguiente. Sea f : R → (0, 1) la función: f (x) = 1 2−x si x < 0, y f (x) = 2x+1 2x+2 si x ≥ 0 Si R fuese numerable, con la correspondencia anterior se podría establecer una biyección entre N y el intervalo (0, 1), lo cual es imposible. Por tanto, R tampoco es numerable. En cuanto a los resultados anteriores, nos limitaremos a hacer algunas observaciones que consideramos relevantes. 1. La idea de recorrer un arreglo bidimensional infinito para definir un nuevo objeto o para demostrar una imposibilidad, meollo del método diagonal, ha sido explotada con éxito en la matemática moderna. Una curiosa aplicación que queremos mencionar fue la lograda por William F. Dowling en 1989 cuando demostró, mediante un argumento diagonal, que ningún programa diseñado para detectar virus en la computadora puede ser a la vez 100 % seguro, en el sentido de que no alterará el código del sistema operativo de la máquina, y 100 % efectivo en el sentido de que sí detecta todos los programas que alterarán el código del sistema operativo.47 Esto refuerza la afirmación de que Cantor, más allá de una simple prueba, lo que en realidad hizo fue introducir un nuevo método de prueba. 2. La prueba o demostración de que el conjunto de los números racionales es numerable es de una naturaleza más simple que la demostración de que R no es numerable. En la primera lo único que se tuvo que hacer fue definir un mapeo entre dos conjuntos. Esto requirió cierto grado de ingenio, pero una vez definida la correspondencia nada quedó por hacer. En cambio, para la segunda fue necesario probar que cualquier intento por definir una correspondencia uno a uno entre N y R estaría condenado al fracaso, es decir, hubo que demostrar una imposibilidad. Obviamente, probar una imposibilidad es más complicado que especificar una correspondencia. De hecho, para demostrar que algo es imposible hay que proceder de manera indirecta, por reducción al absurdo. Así, en la prueba anterior el absurdo se obtiene al suponer que la enumeración incluye a todos los 47 Véase Dowling, 1989. 122 2. L A MATEMÁTICA MODERNA Y LA TEORÍA DE CONJUNTOS números reales del intervalo (0, 1). Cabe señalar que los teoremas de incompletud de Gödel pertenecen a esta clase; por ejemplo, el primero de ellos establece que bajo ciertas circunstancias es imposible definir un cuadro recursivo de axiomas para la aritmética que sea deductivamente completo. La cuestión de demostrar una imposibilidad es tan sutil que incluso en el siglo XVII no se tenía la idea de establecer resultados de este tipo. 3. La no numerabilidad de R tiene una importante consecuencia respecto a los números irracionales. Se llama trascendente a todo número que no es algebraico.48 La existencia de números trascendentes no se conoció sino hasta 1844, año en que Joseph Liouville demostró que cualquier número de la forma d1 d2 d3 dn + + + . . . + n! + . . . 10 102! 103! 10 donde cada di es alguno de los dígitos 1, 2, 3, 4, 5, 6, 7, 8 ó 9, es trascendente. Posteriormente, en 1873 y 1882 respectivamente, Charles Hermite y Ferdinand Lindemann probaron que los números e (base de los logaritmos naturales) y π (relación entre la circunferencia y su diámetro) son trascendentes.49 En este sentido el teorema de Cantor sobre la no numerabilidad del continuo muestra no sólo que existen números trascendentes, sino que éstos son más “numerosos” que los algebraicos.50 Resulta entonces que la teoría cantoriana proyecta luz sobre un problema matemático que parecía fuera de su alcance, revelando con ello su fuerza y ductilidad. 4. Al tipo de demostración utilizado por Cantor para probar la existencia de números trascendentes le podemos llamar prueba de existencia por el absurdo. En esta clase de demostraciones la “existencia” de un ente se prueba indirectamente, deduciendo una contradicción a partir de su supuesta inexistencia. El problema con este tipo de argumentos es que en vez de entregar un objeto, lo que ofrecen es una contradicción. Este uso polémico del principio del tercero excluido, sobre el que se apoyan las demostraciones de este tipo, pronto se convirtió en el blanco de las críticas de quienes se oponían a admitir como válidos razonamientos en los que se deduce la existencia de un objeto sin indicar cómo se le puede hallar. 48 Es decir, los números trascendentes son los que no son solución de una ecuación algebraica. El nombre, propuesto por Euler, alude al hecho de que trascienden todo procedimiento algebraico para caracterizarlos. Obviamente, todo número racional es algebraico, o bien, todo número trascendente es irracional. 49 Estas pruebas pronto se vieron inmersas en un mar de críticas a causa de su carácter no constructivo. De esto nos ocuparemos en los capítulos 3 y 4. 50 En efecto, si el continuo es la unión de los conjuntos de números algebraicos y trascendentes, y el conjunto de números algebraicos es numerable, entonces el conjunto de números trascendentes tiene mayor cardinalidad. Así, se puede decir que “ordinariamente” un número real es trascendente y “excepcionalmente” es algebraico, aunque en la práctica la mayoría de los números con los que tratamos son de esta última especie. Cf. Fraenkel, 1976, pp. 38-39. 2.6. L A TEORÍA DE LOS NÚMEROS TRANSFINITOS DE C ANTOR 123 A esta cuestión habremos de volver en los capítulos 3 y 4, pues se convirtió en una herramienta muy utilizada en la matemática, y en un tema de debate entre el intuicionismo y la escuela de Hilbert. 5. De la no numerabilidad de R se sigue que este conjunto no se puede hacer corresponder con el de sucesiones finitas de números racionales, pues este último es numerable. Esto significa, entre otras cosas, que los números reales no se pueden definir mediante tales sucesiones y que las cortaduras de Dedekind (o algo semejante a ellas) son inevitables en la construcción de los números reales a partir de los enteros. Como veremos, para superar esta dificultad Hilbert trató de caracterizar axiomáticamente el concepto, creyendo que de este modo podría evitar el uso del infinito actual. 2.6.4. La hipótesis del continuo El descubrimiento de que los números reales forman un conjunto no numerable llevó a Cantor a profundizar en la cuestión de la equipotencia entre conjuntos. En 1874 le escribió una carta a Dedekind en la que, exaltado, le pregunta si habrá una biyección entre los puntos de una superficie y un segmento de recta, cuestión considerada absurda por sus coetáneos: “¿Será posible –se pregunta– mapear singularmente una superficie (supón un cuadrado incluyendo sus lados) sobre una línea (supón un segmento incluyendo sus extremos), de modo que a cada punto de la superficie le corresponda un punto del segmento y, recíprocamente, a cada punto del segmento le corresponda un punto de la superficie?”.51 Cantor estaba consciente de las dificultades que encerraba este problema y supuso que la respuesta sería negativa. No obstante, en 1877 ya había resuelto favorablemente la cuestión: sí es posible hacer corresponder los puntos de una superficie con los de un segmento. En una carta dirigida a Dedekind, en la que esboza una demostración un tanto más general, exclama: “¡lo veo y no lo creo!”52 . Parte de su asombro se debía a que ahora era posible determinar mediante un sólo número la posición de un punto en cualquier espacio continuo de dimensión n, lo cual ponía en duda la idea de que esto sólo se podía hacer mediante n coordenadas independientes. Lo siguiente es un bosquejo de la prueba de que los puntos de un cuadrado se pueden poner en correspondencia uno a uno con los puntos de uno de sus lados. Este resultado, enteramente contra intuitivo, es el punto de partida de una demostración de alcance más general: que toda superficie continua tiene la misma cardinalidad que el intervalo (0, 1) y, por tanto, que R.53 51 Citado en Dauben, 1979, p. 54. en Dauben, 1979, p. 55. 53 La prueba que ofrecemos es una versión simplificada de la que Cantor ofreció a Dedekind en 1877 52 Citado 124 2. L A MATEMÁTICA MODERNA Y LA TEORÍA DE CONJUNTOS Consideremos un cuadrado de lado 1 y pongamos uno de sus vértices en el origen y uno de sus lados sobre el eje X, como se muestra en la figura. Sean x e y las coordenadas de un punto del cuadrado, de modo que x = 0.a1 a2 a3 . . . an . . . e y = 0.b1 b2 b3 . . . bn . . . donde cada ai y cada b j es alguno de los dígitos 0, 1, 2, 3, 4, 5, 6, 7, 8, ó 9 y no hay terminaciones infinitas de nueves.54 Formemos ahora un número t intercalando los dígitos de la fracciones decimales anteriores: t = 0.a1 b1 a2 b2 a3 b3 . . . an bn . . . Así, a cada pareja de números (x, y) con 0 < x < 1 y 0 < y < 1 le corresponde de manera unívoca un número t perteneciente al intervalo (0, 1). Por tanto, el interior del cuadrado no tiene más puntos que uno de sus lados. El argumento anterior es una prueba de que el conjunto ℑ = (0, 1) × (0, 1) es equivalente a un subconjunto del intervalo (0, 1).55 También podemos probar la inversa de esta proposición, es decir, que el intervalo (0, 1) es equivalente a un subconjunto de ℑ. Por ejemplo, consideremos la función d : (0, 1) → ℑ definida por: d(x) = (x, x) La función d es unívoca y asocia a cada punto del intervalo (0, 1) un punto sobre la diagonal del cuadrado unitario. Por tanto, el intervalo (0, 1) es equivalente a un subconjunto de ℑ. Con base en el teorema de la equivalencia de Schröder-Bernstein,56 concluimos que los conjuntos (0, 1) e ℑ son equivalentes y tienen la misma cardinalidad. De manera semejante se puede demostrar que algunos otros conjuntos tienen la misma potencia que R. Los siguientes son algunos ejemplos: 1. El conjunto de pares ordenados de números reales (en lenguaje geométrico: el conjunto de puntos en el plano). 2. El conjunto de ternas ordenadas de números reales (en lenguaje geométrico: el conjunto de puntos del espacio tridimensional). 3. En general, el conjunto Rn de sucesiones finitas de n números reales, para cada n fija (en lenguaje geométrico: el conjunto de puntos en un espacio de dimensión n). de que toda variedad continua de p dimensiones puede ser puesta en correspondencia biunívoca con una curva continua. La prueba de Cantor presenta un error que invalida la demostración, pero no el resultado. Cf. Carta de Cantor a Dedekind fechada el 20 de junio de 1877, en [Sestier, 1981, pp. 54-56]. 54 Véase al respecto la nota al pie 46 de esta sección. 55 Véase la página 5 del apéndice F con relación al concepto de equivalencia entre conjuntos. 56 Al respecto, véase la página 7 del apéndice F. 2.6. L A TEORÍA DE LOS NÚMEROS TRANSFINITOS DE C ANTOR 125 4. El conjunto RN de sucesiones x1 , x2 , x3 , . . . , xn , . . . de números reales. 5. El conjunto ℘(N) de subconjuntos de N. 6. El conjunto C de todas las funciones de R en R que son continuas.57 Amén de los números naturales y los números reales, Cantor no pudo demostrar que hubiese conjuntos infinitos de otros tamaños, e ignoraba si había algo más grande que el conjunto de los números reales (nos referimos a 1874). En cuanto al continuo numérico, ese mismo año enunció en su forma primitiva la hipótesis del continuo, al afirmar que todo conjunto infinito de puntos en la recta numérica se puede poner en correspondencia uno a uno con los números reales o con los números naturales, es decir, que no hay posibilidades intermedias. Incluso anunció que pronto daría una demostración. La promesa anterior jamás se cumplió y ahora sabemos la razón de ello: la conjetura de Cantor es independiente de los principios adoptados por él, es decir, se puede asumir su negación sin incurrir en contradicciones. Esto lo demostraron Kurt Gödel y Paul Cohen entre 1938 y 1963. Como el lector se dará cuenta, la situación es análoga a la del quinto postulado de Euclides.58 Dada la representación de los puntos de la recta con números reales, la hipótesis del continuo se puede plantear en los siguientes términos: ¿hay algún conjunto infinito de números reales que no sea equipotente ni con N ni con R? Asimismo, haciendo uso del concepto de número cardinal, que extiende el concepto de número a conjuntos infinitos, esta última pregunta se puede formular en cualquiera de las siguientes formas: ¿cuántos puntos hay en la recta?, ¿cuántos números reales hay?, ¿cuántos conjuntos de números naturales hay?, o bien, ¿hay algún número transfinito entre el cardinal de N y el cardinal de R? La hipótesis del continuo es simplemente la afirmación de que no lo hay.59 57 Estos resultados son discordantes con los dictados del sentido común. En efecto, en contra de lo que la intuición nos haría pensar, lo que Cantor demuestra es que cualquier segmento tiene el mismo número de puntos que una línea, que un plano, que todo el espacio tridimensional, o que un espacio con un número numerable de dimensiones. Lo anterior no es sino un recordatorio de que la matemática muy a menudo procede a contrapelo con la intuición, como cuando Peano demuestra que hay una curva continua que llena todo un cuadrado. 58 El problema planteado por la hipótesis de continuo no obedece en sí a ninguna cuestión práctica y para algunos representa uno de los puntos más enigmáticos de la teoría, ya que la prueba de su independencia no resuelve el problema de saber si ahí, en el "mundo"de los conjuntos, es verdadera o falsa la conjetura. Esto, obviamente, parte de la suposición de que la teoría de conjuntos trata con conceptos e ideas que tiene existencia propia, al margen de que las podamos conocer: una postura idealista, platónica, de la que Gödel es un gran exponente. 59 La hipótesis del continuo ha sido importante por varias razones. En primer lugar, se trata de una cuestión natural relativa a los conjuntos infinitos más pequeños, la cual se puede formular de muchas y muy distintas maneras. En segundo lugar, se trata de un problema que con el paso del tiempo llamó la atención de numerosos matemáticos, forzándolos, en su intento por resolverlo, a explorar extensas regiones del pensamiento matemático. De hecho, las dos ideas más fructíferas e interesantes de la teoría 126 2. L A MATEMÁTICA MODERNA Y LA TEORÍA DE CONJUNTOS La teoría cantoriana excede con mucho lo expuesto en estas páginas. En realidad, lo único que hemos hecho ha sido mostrar sus rudimentos y exponer brevemente dos resultados capitales acerca de los conjuntos de puntos en la recta numérica, cuestiones que se hallan en el punto de partida. Para apreciarla, habría que adentrarse en sus dos grandes vertientes, de las que sólo hemos señalado algunos aspectos: en primer lugar, una teoría general que comprende los teoremas sobre conjuntos de puntos que vimos en esta sección; en segundo lugar, una teoría de números transfinitos que apenas si tocamos en el apéndice F. Además, se cuenta con los argumentos filosóficos sobre los que Cantor sustenta su teoría y que se hallan dispersos en cartas y escritos. Finalmente, si lo que se desea es tener una panorámica completa, es indispensable transitar por la teoría axiomática de conjuntos, misma que Cantor no consideró, y que dio inicio en 1904 con los trabajos de Ernst Zemelo (1871-1953). Al respecto, en la sección 3.5 abordamos brevemente dicho tratamiento axiomático. 2.6.5. El axioma de elección Hacia 1900 dos preguntas seguían sin respuesta en la teoría de conjuntos: la validez de la hipótesis del continuo y el problema de la buena ordenación del conjunto de los números reales, cuestión esta última que pronto se generalizó a todos los conjuntos. Para ubicar estos problemas en su justa perspectiva conviene trazar una breve cronología. Entre 1874 y 1897 Cantor dio forma a la teoría de los números transfinitos. Primero hizo explícita la noción de correspondencia uno a uno y enunció la hipótesis del continuo en su forma primitiva (como conjetura relativa a los puntos de una recta). Hacia 1882 introdujo la noción de buen orden y demostró que la segunda clase de los números ordinales –la clase Ω– está bien ordenada bajo la relación de pertenencia y que todo subconjunto de ella es equipotente con N o con Ω misma (es decir, que no hay casos intermedios, como Cantor lo suponía del continuo).60 Por tanto, para demostrar la hipótesis del continuo bastaba con probar que R es equipotente con Ω (esta última afirmación es la forma final de la hipótesis del continuo). Hacia 1884 Cantor clasificó numerosos conjuntos como numerables o equivalentes al continuo y construyó números ordinales de la segunda clase mediante el segundo principio de formación de ordinales o proceso de paso al límite. Fue entonces que creyó poder coronar sus esfuerzos con una demostración de la hipótesis del continuo.61 axiomática de conjuntos, la constructibilidad y el forcing, se introdujeron a fin de dar respuestas parciales a este problema. En tercer lugar, para los defensores del realismo conceptual se trata de un problema no resuelto, pues su independencia no responde a la pregunta por su verdad, lo que los ha llevado a buscar nuevos principios a partir de los cuales se pueda decidir su “verdad”. El problema del continuo se asemeja en la teoría de conjuntos a un tema sinfónico que se repite una y otra vez y que podría servir como hilo conductor para exponer sus preocupaciones centrales. Si le hemos dedicado un considerable espacio es porque ejemplifica muy bien el tipo de problemas que Gödel tenía en mente al momento de ponderar la relación entre verdad, completud y demostrabilidad en el seno de una teoría axiomática. 60 Ω es la clase de ordinales numerables. Véase el apartado sobre aritmética ordinal en el apéndice F. 61 Tras varios intentos fallidos Cantor, desilusionado, intentó desligarse por completo de las matemáticas 2.6. L A TEORÍA DE LOS NÚMEROS TRANSFINITOS DE C ANTOR 127 A fines de 1885 Cantor inició un segundo período de productividad, en el que el interés por los conjuntos de puntos cedió su lugar al interés por los números transfinitos. En 1891 presentó una nueva demostración de la existencia de conjuntos no numerables con base en el ahora famoso método de la diagonal. La técnica utilizada le permitió demostrar en forma por demás elegante que el conjunto potencia ℘(A) de cualquier conjunto A, finito o infinito, tiene una cardinalidad mayor que la de A, lo que lo llevó a establecer una jerarquía ascendente e ilimitada de cardinales transfinitos.62 En 1895-97 publicó dos escritos en los que expuso de manera sistemática los resultados alcanzados en la teoría de conjuntos e introdujo la notación de los aleph, aunque, a falta del teorema del buen orden, dejó pendiente la proyectada aplicación de la teoría de los números ordinales a la teoría de los números cardinales.63 También demostró que la potencia de R es la misma que la de ℘(N), y expresó de manera sucinta la hipótesis del continuo mediante la ecuación 2ℵ0 = ℵ1 . No obstante, Cantor no generalizó esta conjetura al resto de los aleph; esto último fue obra de Felix Hausdorff quien en 1908 formuló la hipótesis generalizada del continuo, según la cual 2ℵα = ℵα+1 para todos los ordinales α (véase el apartado La hipótesis generalizada del continuo del apéndice F). Entre los teoremas clásicos de la teoría de conjuntos que Cantor no demostró destacan el teorema de la equivalencia, demostrado por Schröder y Bernstein en 1898 y dos teoremas demostrados por Ernst Zermelo en 1904: la tricotomía, que establece que todos los números cardinales son comparables entre sí, y el teorema del buen orden, que afirma que todo conjunto se puede bien ordenar. Para demostrar este último teorema Zermelo debió recurrir a un principio que ya se había utilizado inadvertidamente en el análisis matemático. Lo presentó bajo el y dedicarse a la filosofía, postura que se vio acentuada por la hostilidad de algunos matemáticos hacia él, principalmente Kronecker. Estos acontecimientos significaron el fin de su período de mayor creatividad. Hacia 1885 el apoyo de algunos colegas, sobre todo el de su editor y amigo Gösta Mittag-Leffler (1846-1927), y la adhesión a su trabajo de nuevos matemáticos, renovaron su interés por la teoría. 62 Véase el apartado sobre cardinales transfinitos superiores en el apéndice F. La demostración es tan simple que la podemos bosquejar en pocas líneas. Sea A un conjunto arbitrario y sea f : A → ℘(A) una correspondencia uno a uno. Vamos a demostrar que hay un subconjunto A de A que no figura en la correspondencia. Dado que la imagen f (a) de cada elemento a de A es un subconjunto de A, tiene sentido preguntarse si a mismo pertenece a su imagen, es decir, si a ∈ f (a). Formemos entonces el conjunto A = {a|a ∈ / f (a)} constituido por aquellos elementos de A que no pertenecen a su imagen. Supongamos que A es imagen de algún elemento a de A, i. e., que hay un a ∈ A tal que f (a ) = A . ¿Es a un elemento de A ? Cualquiera que sea la respuesta, ésta conduce a su negación. Por ejemplo, si a ∈ A , entonces, por definición de A , a ∈ / f (a ) = A . En cambio, si a ∈ / A , entonces a es un elemento de A que no pertenece a su imagen y por tanto pertenece a A , pues dicha condición es lo que define a A . Conclusión: a ∈ A si y sólo si a ∈ / A , una contradicción. Así, A no puede ser imagen de ningún elemento de A, y ℘(A) no se puede poner en correspondencia uno a uno con A ¿En dónde aparece el método de la diagonal? Respuesta: en la definición de A . 63 Si se pudiera definir un buen orden en el conjunto R de los números reales, su situación en la escala cardinal se podría determinar mediante el número ordinal correspondiente, quedando resuelto con ello el problema del continuo. Obviamente, este problema es tan sólo un caso particular del problema más general de bien ordenar cualquier conjunto, no sólo el de los números reales. 128 2. L A MATEMÁTICA MODERNA Y LA TEORÍA DE CONJUNTOS nombre de axioma de elección y su adopción fue de inmediato motivo de enconadas polémicas que, de algún modo, influyeron en las discusiones en torno al fundamento de la matemática a principios del siglo veinte. El principio pronto se extendió a otras áreas de la matemática y en la actualidad es una herramienta de uso general. A fin de clarificarlo tomemos un ejemplo del análisis matemático. Sea C un conjunto de puntos en el plano, y P0 un punto del plano que no pertenece a C, pero que tiene la propiedad de que cualquier disco con centro en P0 contiene un punto de C. El problema es demostrar que existe una sucesión Q1 , Q2 , . . . , Qn , . . . de puntos de C cuyo límite es P0 . El argumento es simple: para cada n 1 sea Dn el disco con centro en P0 y radio 1/n, como en la figura a la derecha. Por hipótesis, hay un punto Q1 ∈ D1 ∩ C, un punto Q2 ∈ D2 ∩C, etc. Estos puntos forman la sucesión buscada, pues para cada número natural n 1, la distancia entre Qn y P0 es menor que 1/n, por lo que el límite de la sucesión es P0 . Si examinamos la forma del argumento, podremos ver que se ha utilizado el siguiente principio: Si (Cn ) es una colección de subconjuntos no vacíos de un conjunto C (en el ejemplo Cn = Dn ∩C), entonces existe un mapeo n → Cn de N en C tal que para cada n, cn ∈ Cn . Esta conclusión puede parecer natural, pero cuando Giuseppe Peano la tuvo que aplicar a un conjunto C de funciones (hablamos de 1890) hizo la observación de que para cada n, el elemento cn no está determinado de manera única (Cn es por lo general un conjunto infinito), por lo que es necesario hacer una infinidad de elecciones sucesivas, y esto último le pareció inaceptable. La primera vez que Zermelo enunció este principio lo hizo de la siguiente manera: Para cualquier colección de conjuntos no vacíos siempre hay un mapeo que a cada uno de dichos conjuntos le asocia uno de sus elementos.64 En 1908 Zermelo lo volvió a enunciar bajo el desafortunado nombre de “axioma de elección” con las siguientes palabras: Un conjunto S que se puede descomponer en un conjunto de partes ajenas A, B, C, . . ., cada una de las cuales contiene al menos un elemento, posee al menos un subconjunto S1 que tiene exactamente un elemento en común con cada una de las partes A, B,C, . . . consideradas.65 64 Cf. Zermelo, 1904, en Heijenoort, 1967, p. 141. 1908. Tomado de Heijenoort 1967, p. 186. Una tercera formulación –en Zermelo 1908a–, es la siguiente: Si T es un conjunto cuyos elementos son conjuntos no vacíos y ajenos entre sí, entonces su unión ∪T incluye al menos un subconjunto S1 que tiene uno y sólo un elemento en común con cada elemento de T . El conjunto ∪T resulta al reunir en un sólo conjunto todos los elementos de los conjuntos en T . En cuanto al tratamiento axiomático de la teoría, el lector podrá consultar la sección 3.5. 65 Zermelo, 2.6. L A TEORÍA DE LOS NÚMEROS TRANSFINITOS DE C ANTOR 129 Lo que el axioma de elección dice es que si S es un conjunto cuyos elementos son a su vez conjuntos no vacíos A, B,C, . . ., (de cualquier cardinalidad), es “posible” (esto es lo que afirma) elegir de cada uno de estos conjuntos A, B,C, . . ., un elemento determinado, a en A, b en B, c en C, ..., y razonar válidamente sobre el nuevo conjunto S1 formado por la reunión de tales elementos a, b, c, . . ., en una totalidad. El lado polémico consiste en que el axioma tiene un carácter puramente existencial, pues en él no hay ninguna indicación sobre cómo construir o formar el nuevo conjunto, lo que para algunos es inadmisible en el dominio de los conjuntos infinitos. En la escala de los conjuntos finitos lo que el axioma declara es una perogrullada. Imaginemos un auditorio que contiene un número finito de espectadores, cada uno de los cuales tiene en su bolsillo un conjunto finito de monedas (una por lo menos: ninguno es víctima de la pobreza extrema). Para reunir fondos se pide a cada uno de los asistentes que aporte, sin excepción, una y sólo una de sus monedas para formar así un nuevo conjunto de monedas. Esta colección tendría la misma potencia o cardinalidad que el conjunto de espectadores. Nada más simple que afirmar la existencia de tal conjunto, tal como lo hace el axioma. Mas la teoría de conjuntos tuvo la virtud de sembrar la discordia donde antes había una verdad de Perogrullo. Si bien todo el mundo estaba dispuesto a reconocer la validez del axioma de elección al nivel de los conjuntos finitos, en cuanto a su legitimidad en el dominio de los conjuntos infinitos suscitó interminables polémicas. Para unos era algo evidente y bastaba con enunciar el postulado para reconocer su legitimidad; para otros era algo carente de sentido, una mezcla confusa de palabras desprovistas de significado. Por ejemplo, Emile Borel (1871-1956) decidió ignorar el axioma de Zermelo y continuar haciendo matemáticas sin él. Otros, herederos de la tradición cantoriana, lo admitieron y extrajeron de él consecuencias muy interesantes. Obviamente, estas consecuencias fueron vistas con recelo por aquellos que veían en el axioma un sinsentido. Esta querella ha continuado hasta nuestros días y parece que sólo se resolverá en el fastidio, pues ninguno de los participantes parece dispuesto a abandonar su trinchera ni se prevé cómo podría doblegar a su oponente. Al igual que Cantor y Zermelo, Hilbert admite el axioma de elección y acepta la existencia de un buen orden para el continuo; por el contrario, algunos matemáticos franceses, entre ellos Poincaré, Borel, Lebesgue y Baire, impugnaron de inmediato el axioma o se mostraron escépticos o indiferentes. Las críticas se centraron básicamente en dos aspectos: en la pretensión de abandonar el ámbito de la intuición en favor del tratamiento formal y en el sentido de la existencia matemática. Por ejemplo, cuestionaron la validez de un axioma como el de elección que supone una infinidad de elecciones arbitrarias simultáneas (¿no es esto inconcebible desde un punto de vista intuitivo?), aduciendo que para abordar estos problemas es preciso saber qué es lo que se quiere decir cuando se afirma que un ente matemático existe. V. gr., ¿tiene sentido hablar de la existencia de un conjunto del que no sabemos nombrar todos sus elementos? La conclusión a la que llegaron algunos de ellos fue que no tenía sentido hablar de entes como el conjunto potencia de un conjunto infinito dado, aunque ello 130 2. L A MATEMÁTICA MODERNA Y LA TEORÍA DE CONJUNTOS tuviera como consecuencia rechazar el sistema de los números reales. Esta postura fue compartida por todos los adversarios del infinito actual.66 Hacia 1912 el matemático holandés L. E. J. Brouwer (1881-1966) vio en el fondo de la discusión dos grandes corrientes del pensamiento, que identificó como intuicionismo (sobre todo francés) y formalismo (sobre todo alemán), convirtiéndose en abanderado de la primera de ellas. Con ideas semejantes emprendió la reconstrucción de la matemática, abogando por la exclusión de la teoría transfinita de Cantor y de todo aquello que se basara en la noción de infinito actual, como el axioma de elección.67 A este tema habremos de volver en los siguientes capítulos, cuando consideremos en extenso la polémica entre Hilbert y Brouwer. 2.6.6. Dos comentarios y un epílogo 1. Es evidente que el tratamiento del infinito señala una diferencia capital entre la matemática antigua (digamos hasta 1800) y la moderna. La primera lo evita a toda costa, como Euclides, que propone la línea recta como tendida entre dos puntos y tiene la precaución de avisar que la va a prolongar más allá de dichos límites, mientras que la segunda recurre a él sistemáticamente, como en la geometría proyectiva que acepta los puntos y la recta al infinito para alcanzar la generalidad. Lo máximo en esta tendencia es la teoría de conjuntos de Cantor, en la que el infinito no sólo se explora, sino que se jerarquiza y ordena. No obstante, a pesar del feraz uso que se hace de él en la matemática moderna, el infinito actual sigue siendo una noción que no es aceptada por todos. Si bien la matemática moderna logró despojar al infinito de esa metafísica farragosa que ocultaba una joya, las polémicas no han dejado de acompañar a esta teoría. Por ejemplo, hoy en día se sigue debatiendo acerca de si al lado del infinito potencial hay un infinito actual, categórico, o si éste sólo representa un desvarío medieval. Tal parece que las diferencias al respecto tienen raíces sicológicas (horror al infinito), lógicas (distintas leyes para la igualdad, para comparar los infinitos, etc. con relación a lo finito) y sociales (actitud y disposición de un grupo para su aceptación), que van desde el escepticismo de Kronecker hasta el místico atrevimiento de Cantor. Estos contrastes los podemos advertir al recorrer la galería de matemáticos y filósofos que han tomado parte en el debate. Para unos, el infinito es la imposibilidad de imponer un límite a una operación del intelecto y sólo puede ser potencial, pues el entendimiento lo único que puede 66 Tales críticas se encuentran descritas de manera clara y poco sistemática en [Baire et al, 1905]. 67 En contra de este tipo de argumentos opuestos al axioma de elección, hay un interesante comentario de Jean Dieudonné que ilustra muy bien la opinión que tiene la mayoría de los matemáticos contemporáneos acerca de tales pretensiones: “Un conjunto no es un objeto en un escaparate del que “escogemos” objetos, del mismo modo en que una línea no es un cordel estirado entre dos puntos, y no es más razonable rechazar el axioma de Zermelo, que no hace sino afirmar la existencia de un objeto matemático (un mapeo), del mismo modo en que no nos es posible rechazar el primer postulado de Euclides alegando que no es posible estirar un cordel entre la Tierra y Sirio.” Cf. Dieudonné, 1992, p. 225. 2.6. L A TEORÍA DE LOS NÚMEROS TRANSFINITOS DE C ANTOR 131 hacer es afirmar su capacidad de repetir interminablemente la misma operación. Para otros, el infinito se realiza, es actual, es un límite alcanzado y superado: se puede ir al otro lado de él. Un par de citas hará más claras las posturas. Escuchemos a Gauss: Protesto contra el uso de una cantidad infinita como una entidad actual; eso no está permitido en matemáticas nunca. El infinito es solamente una manera de hablar, en la que uno está realmente hablando de límites a los que ciertas razones pueden aproximarse tanto como se quiera, mientras que otras crecen ilimitadamente.68 Cantor, que hubo de abandonar Berlín a causa de la hostilidad de sus críticos en un vergonzoso episodio de intolerancia, se refiere a su reencuentro con Kronecker (el más implacable de ellos) con las siguientes palabras: La entrevista que tuve con él no dio un solo nuevo pensamiento de su parte y lo que él opone a mis números transfinitos no son más que los ingeniosos argumentos de la escuela escéptica de hace 2000 años contra el infinito actual; la repetición de estos argumentos, respectivamente sofismas, ni aún en boca de un hombre tan listo y bien situado como el señor Kronecker, para nada los hace más fuertes, convincentes o acertados.69 Aunque el debate en torno a las dos concepciones del infinito no ha llegado a su fin (de ello nos ocuparemos en el siguiente capítulo), la importancia y belleza de la teoría de conjuntos es reconocida hoy en día como nunca antes. En la actualidad casi todo el mundo juzga que Cantor no se equivocó al construir una teoría del infinito actual. Por el contrario, las nuevas generaciones han visto en ella una idea fascinante y un signo de renovación. Esta actitud se resume en la respuesta que Hilbert diera a Brouwer cuando éste intentó desterrar el infinito actual de la matemática: “Nadie podrá expulsarnos del paraíso que Cantor creó para nosotros.”70 2. Aunque Cantor creía en la realidad objetiva de los números transfinitos, jamás pretendió que los matemáticos aceptaran su teoría con base en tales suposiciones. Más bien, en su defensa sostuvo que la matemática, a diferencia de otras ciencias, no necesita considerar el vínculo entre sus conceptos y la realidad objetiva, sino sus vínculos con el pensamiento mismo, pues la matemática es autónoma y libre de crear sus propios objetos siempre y cuando no incurra en contradicciones. En 1883 escribió: “La matemática es enteramente libre en su desarrollo, y sus conceptos sólo se ven restringidos por la necesidad de ser no contradictorios y estar coordinados con los conceptos previamente introducidos mediante definiciones 68 Gauss, carta a Heinrich Schumaher. Citado en Kline, 1994, p. 1311. carta a Mittag-Leffler. Citado en Sestier, 1981, p. 120. El encuentro fue en octubre de 1884. 70 Hilbert 1925. Cita tomada de la traducción al español, p. 94. 69 Cantor, 132 2. L A MATEMÁTICA MODERNA Y LA TEORÍA DE CONJUNTOS precisas. [...] La esencia de las matemáticas reside en su libertad.”71 Este punto de vista es enteramente congruente con el de Hilbert, para quien ni siquiera es necesario suponer una realidad suprasensible a la que estarían referidos los conceptos matemáticos; más bien, se trata de una ciencia que se ocupa de lo posible, donde por posible se entiende aquello que no lleva a contradicción. En particular, y a esto habremos de volver más adelante, considera que los números transfinitos son nociones ideales que no tenemos por qué suponer referidas a ningún tipo de realidad (y que aunque lo estuvieran no estaríamos en posibilidad de saberlo). A lo que sí está dispuesto es a defender la libertad de imaginar o creer cualquier cosa, incluyendo el paraíso cantoriano. Al respecto, la pretensión de verdad acerca de la naturaleza ya no se encuentra por ninguna parte. Epílogo Con lo poco que hemos ofrecido en una sección muy corta y muy larga a la vez, creemos haber puesto en claro la audacia y originalidad de la teoría de conjuntos. Y si bien esta disciplina ha sido objeto de largos debates de los que aún se escuchan los ecos, también ha tenido la capacidad de irrumpir en toda la matemática, sin dejar ninguna de sus partes completamente fuera de su dominio. De hecho, muchos matemáticos ven en ella la única base legítima que conviene a su disciplina, y un medio para vincular entre sí las partes más diversas, sometiéndolas a una sola jurisdicción. De alguna manera, sus nociones abstractas se han convertido en los elementos básicos de la construcción axiomática que Hilbert impulsa y su lenguaje en una especie de habla universal en la que todo lo matemático es traducible. Es tal su generalidad que sus conceptos han conquistado a la vez el mundo de los números, el de las formas y el de las funciones: ¿qué es la aritmética sino el estudio de conjuntos de números?, ¿qué es la geometría sino el estudio de conjuntos de puntos?, ¿qué es la teoría de funciones sino el estudio de correspondencias entre conjuntos? Y si bien en el pasado se suscitaron algunos problemas que amenazaron con demoler la revolución cantoriana (de ello nos ocuparemos en el siguiente capítulo), la teoría de conjuntos no enfrenta hoy en día ningún peligro que amenace su estabilidad, sino que, por el contrario, constituye una parte importante del pensamiento matemático, proveyéndonos de armas y tácticas inéditas en su estudio y desarrollo. De alguna manera, los nuevos infinitos no sólo nos brindan especulaciones fascinantes y una herramienta matemática de gran ayuda, sino que han cambiado nuestra mentalidad hasta convertirse en el signo y la prueba de que algo importante se ha producido en la historia del pensamiento humano. 71 Cantor, 1883. Citado en Kline, 1994, pp. 1358-59. De hecho, esta cita nos muestra que el origen de la noción de existencia matemática que Hilbert adopta se halla en Cantor, y que su programa de fundamentación de las matemáticas se inspira en gran medida en la defensa de la teoría de los números transfinitos que éste impulsa. Capítulo 3 La cuestión de los fundamentos a principios del siglo veinte 3.1. Introducción. El problema de los fundamentos Como ya lo hemos señalado, tras el notable desarrollo de la matemática en los siglos diecisiete y dieciocho, el siglo diecinueve experimentó un creciente interés por el tema del rigor en esta disciplina. Se investigaron los conceptos básicos, y el conocimiento se organizó en forma sistemática. En el análisis matemático se pudo eliminar el problemático uso de los infinitesimales y el manejo incierto de series y productos infinitos mediante el riguroso manejo del concepto de límite. De la misma manera los distintos sistemas numéricos fueron sólidamente fundamentados y la noción de número real fue reducida a las nociones de número entero y conjunto mediante su construcción genética. Al mismo tiempo la matemática creció en otras direcciones, alcanzando una mayor generalidad y abstracción en comparación con los siglos precedentes. Al hacerlo se incorporaron nociones y métodos que no se podían justificar de la misma manera que los utilizados en la matemática tradicional. Esto hizo que las investigaciones en torno a los fundamentos de esta disciplina no finalizaran con los trabajos ya señalados acerca del análisis, la geometría y los sistemas numéricos. Por una parte la labor reduccionista no fue del agrado de todos, como en el caso de Hilbert, quien prefirió la vía axiomática y las pruebas de consistencia como fundamento. Por otra parte no todos compartían un mismo punto de vista en torno a la naturaleza de la matemática y sus fundamentos. Por ejemplo, para Frege, la aritmética (no la geometría) habría de reducirse a la lógica, mientras que para Kronecker los métodos y procedimientos debían limitarse de modo que ya no habría lugar para los métodos transfinitos de Cantor. En cuanto al dominio propiamente filosófico, la teoría que había dominado la escena a principios del siglo diecinueve -la epistemología de Kant- fue puesta en tela de 133 134 3. L A CUESTIÓN DE LOS FUNDAMENTOS ... juicio en varios de sus aspectos. Como veremos, muchos de ellos se adecuaron de diversas maneras a la evolución teórica y conceptual que había sufrido la matemática, mientras que otros fueron simplemente desechados. Estos aspectos los habremos de examinar con relación a autores como Frege, Russell, Poincaré, Cantor, Brouwer, Hilbert (principalmente éste último) y Gödel, contendientes todos ellos en la arena de los fundamentos de la matemática. Paralelamente, veremos cómo la filosofía de Kant siguió presente en esos días por dos razones: por una parte, por las cuestiones plateadas en ella; por la otra, por las respuestas que propuso. Se podía estar en desacuerdo con él; lo que no se podía hacer era dejar sin respuesta muchas de sus preguntas, sobre todo si lo que se pretendía era elaborar una verdadera epistemología de las matemáticas. Esquemáticamente, a principios del siglo veinte se perfilaron, como resultado de lo anterior, tres grandes corrientes de pensamiento en torno a los fundamentos de la matemática, según se le considerara: (a) como una parte de la lógica, (b) como la ciencia de las construcciones posibles o (c) como la ciencia de lo posible.1 Como veremos, en el centro del debate se hallaba no sólo la matemática, sino la lógica misma, la cual para algunos había dejado de ser algo seguro.2 Con el tiempo estas tendencias terminaron por representarse socialmente bajo tres estereotipos que el lector ya habrá escuchado en alguna ocasión: logicismo, intuicionismo y formalismo. Si bien estos términos no suelen describir toda la riqueza y diversidad de dichas corrientes, en ocasiones son utilizados por algunos de los participantes en el debate en torno a los fundamentos, y en otras suelen ser de utilidad para establecer algún punto con relación a una persona o grupo de personas que comparten ciertas características. 3.2. El logicismo de Frege El primer ejemplo que podemos ofrecer de una postura fragmentada frente a Kant es el de Frege, quien en un escrito de 1884, Die Grundlagen der Arithmetik, sostiene que las verdades geométricas son sintéticas a priori y se basan en la intuición, mientras que las verdades aritméticas son analíticas y se apoyan en la lógica pura. Lo anterior llevó a Frege a la necesidad de reducir la noción de número a nociones puramente lógicas, alejadas de la intuición y del psicologismo.3 Este es el tema central 1 Esta última caracterización corresponde a la concepción que Cantor y Hilbert tienen de la matemática a principios del siglo veinte. En cuanto a las otras dos, en las siguientes secciones nos ocuparemos de ellas con relación a Frege, Russell, Brouwer y Poincaré. 2 Con esto no queremos decir que todos los participantes en los debates estuvieran de acuerdo en el papel y la importancia de la lógica. Así, los primeros propusieron reconstruir primero la lógica y después la matemática como parte de ella, mientras que los segundos abogaron por excluir algunos principios que consideraban injustificados, mientras que los terceros pugnan por la reconstrucción simultánea de la lógica y la matemática, probando la consistencia del sistema resultante como garantía de su confiabilidad. 3 Aquí por psicologismo entendemos la doctrina que afirma que la lógica es una rama de la psicología, y que la validez de la matemática se debe a que es producto de procesos de abstracción del mundo sensible. 3.2. E L LOGICISMO DE F REGE 135 de dos de sus libros: el ya señalado de 1884 y Die Grundgesetze der Arithmetik, publicado en dos volúmenes: Vol. 1 (1893) y vol. 2 (1903). En estas obras Frege propone una definición de la noción de número natural en términos de las nociones básicas de la teoría de clases, concebida ésta como una parte de la lógica. Este proyecto, el de reducirlo todo a la lógica, lo hubieron de continuar posteriormente Bertrand Russell y Alfred N. Whitehead. La idea de Frege era definir la noción de número cardinal de un conjunto X como la clase de equivalencia [X] formada por todos los conjuntos Y equivalentes a X, en el sentido de que hay una correspondencia 1-1 entre los elementos de ambos conjuntos. En breve: el cardinal de X sería una clase, la formada por todas las clases Y tales que X ∼ Y .4 Al leer por primera vez a Frege, uno tiene la impresión de que logra definir las nociones básicas de la aritmética - el número 0, la función sucesor y el conjunto N de los números naturales- en condiciones de aparente pureza lógica. No obstante, la faena no está exenta de problemas, como los derivados de la paradoja de Russell. Aún así, no podemos dejar de reconocer la importancia histórica de su obra, la cual aún se valora hoy en día. Uno de los grandes méritos de Frege fue que para llevar a cabo su programa hubo de desarrollar un nuevo sistema de lógica simbólica que presentó en su Conceptografía (Begriffsschrift) de 1879.5 En esta obra Frege abandona la división aristotélica de la proposición en sujeto-predicado en favor de las nociones de función y argumento y un manejo adecuado de la cuantificación. Esto le permitió reflejar en el terreno de lo simbólico la estructura lógica de las proposiciones sin verse limitado por las inconveniencias de la gramática.6 Con base en estas nociones construyó lo que hoy en día se conoce como lógica de predicados de segundo orden, la cual incluye al cálculo 4 El lector notará que hemos cambiado el término “conjunto” por el de “clase” en la última frase. Esto se debe a que en esta sección queremos emplear la terminología utilizada por Frege. En este contexto el lector puede considerar como sinónimos ambos términos. Al respecto cabe señalar que, a diferencia de algunas teorías modernas en las que las clases se entienden como colecciones que no pueden figurar como elementos de ninguna otra cosa, en el caso de Frege las clases no están sujetas a esta limitación. 5 Hay una traducción al inglés en (van Heijenoort, 1967) y una al español en (Frege, 1972), esta última junto con una traducción de (Frege, 1893). 6 Sin profundizar en el tema, veamos un ejemplo ¿Cómo se podría representar en el contexto de la lógica tradicional un argumento como “hay un hijo, luego hay un padre”? Invitamos al lector a que lo intente ¿Es acaso importante determinar aquí qué elementos pertenecen al sujeto y cuáles al predicado? Una representación razonable sería “algún hombre es hijo, luego algún hombre es padre”. No obstante, esta última manera de expresar el argumento no explica su validez, pues no expresa aquello que enlaza a la premisa con la conclusión: el hecho de que los predicados “ser padre” y “ser hijo” corresponden a una misma relación recíproca (i. e., al hecho de que si a es hijo de b, entonces b es padre de a). En la teoría de la cuantificación el argumento se puede representar mediante una predicado binario R(x, y) que corresponde a la relación “x es hijo de y” o “y es padre de x”: ∃x∃yR(x, y) ∃y∃xR(x, y) 136 3. L A CUESTIÓN DE LOS FUNDAMENTOS ... de predicados de primer orden. Se trata de una contribución fundamental a la lógica moderna, expresada inicialmente en un simbolismo bastante oscuro que posteriormente se habría de desechar a favor de otro más eficiente. En el sistema de Frege las variables individuales se extienden sobre todos los objetos del universo, concretos o abstractos, y por ende sobre todos los objetos matemáticos. A su vez, las variables de segundo orden se extienden sobre predicados o propiedades arbitrarias (los conceptos, en la terminología de Frege), al igual que sobre relaciones arbitrarias.7 Con base en esta explicación un tanto imprecisa,8 a continuación exponemos ciertos principios que Frege asume como axiomas para la lógica, y a partir de los cuales busca definir las nociones de cardinal de un conjunto X y de número natural. Como veremos, el axioma de extensionalidad (Ley básica V) implica una contradicción. La notación no es necesariamente la de Frege, quien a veces sólo utiliza el lenguaje natural. Axioma de comprensión para propiedades Cada función proposicional α(x) determina una propiedad P que se cumple para una x arbitraria si y sólo si α(x) es verdadera. En símbolos ∃P∀x(P(x) ⇔ α(x)) donde P es una variable predicativa que no figura en α(x). Axioma de extensionalidad (Ley básica V) Toda función proposicional α(x) determina una clase x̂α(x) que es su extensión (en la actualidad dicha clase se denota con {x|α(x)}); además, dos funciones α(x) y β (x) determinan una misma clase si y sólo si son coextensivas. En símbolos x̂a(x) = x̂β (x) ⇔ ∀x(α(x) ⇔ β (x)) En la teoría de Frege se supone que las clases son objetos matemáticos, por lo que pertenecen al universo de individuos. En otras palabras, cada x̂α(x) es un término de primer orden que puede ser instancia de cualquier propiedad aplicable a individuos. Es así que la teoría de clases forma parte del sistema de Frege, y en ella la relación de pertenencia entre individuos y clases se introduce mediante la siguiente igualdad: (y ∈ z) =de f ∃P(z = x̂P(x)&P(y)) De lo anterior resulta que tenemos un axioma similar al primero de esa lista, pero para clases: 7 Para 8 Un Frege, todo concepto es el significado de un predicado, es decir, su referencia. análisis a fondo se encuentra en (Dummett, 1991). 3.2. E L LOGICISMO DE F REGE 137 Axioma de comprensión para clases y ∈ x̂α(x) ⇔ α(y) Con base en estos y otros principios Frege se dispone a definir el conjunto de los números naturales N y a probar que éste constituye un sistema en el que se cumplen todas las propiedades que ahora reconocemos como axiomas de Peano. Una idea de vital importancia para la concepción logicista de Frege es que los números son objetos, no conceptos, los cuales “por accidente” suelen aparecer en el lenguaje como adjetivos numerales. Por ejemplo, en el enunciado “La silla tiene cuatro patas”, “cuatro” aparece como tal (como adjetivo). No obstante, Frege ve en esto un accidente gramatical que nada tiene que ver con la naturaleza de los números. Propone entonces reformular esta clase de enunciados de modo que los términos numéricos figuren como términos singulares, es decir, como objetos.9 En nuestro ejemplo, “El número de patas de la silla es cuatro”. Aduce que si los números fueran conceptos, entonces tendría sentido preguntarse cosas como si un objeto cae bajo el concepto cuatro. Tras ofrecer muchas otras razones para pensar que los números son objetos, concluye que toda aseveración acerca de números es acerca de objetos. Esta es quizá la aseveración más importante de los Grundlagen der Arithmetik. Aclaremos esta idea con el ejemplo anterior. Según Frege, el significado real del enunciado “El número de patas de la silla es cuatro” es que sólo hay cuatro objetos que caen bajo el concepto pata de la silla. Por lo tanto, estamos ante una afirmación acerca de la extensión del concepto pata de la silla. Siguiendo a Hume, considera que la única manera de reconstruir el contenido de los juicios que comprenden identidades numéricas es mediante la noción de equinumerosidad: el número de cosas que caen bajo el concepto P es el mismo que el número de cosas que caen bajo el concepto Q.10 Con base en estas ideas define a los números como extensiones de conceptos. Para logar lo anterior, lo primero era definir el concepto de equinumerosidad con base en la noción de correspondencia biyectiva utilizada por Cantor. Sean P y Q dos predicados (conceptos): Eq(P, Q) ⇔de f ∃R∀x∀y[(P(x) ⇒ ∃!z(R(x, z)&Q(z)))&(Q(y) ⇒ ∃!z(R(z, y)&P(z)))] En otras palabras, P y Q son equinuméricos si y sólo si hay una relación que correlaciona uno a uno los objetos que caen bajo P con los objetos que caen bajo Q. Al respecto, la relación Eq es reflexiva, simétrica y transitiva.11 9 Compárese este enunciado con “La silla tiene feas patas”, donde el término “feas” si corresponde a un concepto que no puede ser tratado como un objeto. 10 Nótese que no se está diciendo que las cosas que caen bajo el concepto P son las mismas que las cosas que caen bajo el concepto Q, sino que sus números son iguales. Se trata de un juicio acerca de números (los asociados a estos conceptos), no de un juicio acerca de las cosas que caen bajo estos conceptos. 11 Nótese que esa noción es de segundo orden, pues se aplica a conceptos, no a individuos. Por otra 138 3. L A CUESTIÓN DE LOS FUNDAMENTOS ... Lo siguiente fue determinar la noción de número de objetos x tales que P(x). Para mostrar cómo se lleva a cabo lo anterior recurrimos a la notación moderna {x|ϕ(x)} para la extensión de un predicado ϕ: Nx P(x) =de f x̂{Q(x)|Eq(P, Q)} En palabras: el número de objetos x con la propiedad P (i. e., el número de objetos que caen bajo el concepto asociado a P) es la clase formada por las extensiones de los predicados Q que son equinuméricos con P. Nótese que se trata de una clase cuyos elementos son clases a su vez. Con estas nociones a la mano Frege logró definir el número 0 como sigue: 0 =de f Nx (x = x) A su vez, la relación “n es el sucesor de m” la definió como sigue: Suc(n, m) ⇔de f ∃P∃z(n = Nx P(x)&P(z)&m = Nx (P(x)&x = z)) En palabras: hay una propiedad P y un objeto z con esa propiedad tales que n es el número de objetos con la propiedad P y m es el número de objetos distintos de z con la propiedad P. Con base en estas definiciones Frege pudo probar muchas propiedades de los números naturales como, por ejemplo, que Suc(1, 0), que ¬∃xSuc(0, x), que si x = 0, entonces ∃ySuc(x, y), etc. Finalmente, Frege introdujo la noción de número finito (número natural) apoyándose en dos nociones ad hoc que aquí no definiremos: la de ancestro de un número y la de concepto ϕ-hereditario. Con base en ellas probó el principio de inducción matemática: Para todos los conceptos (predicados) P, si 0 cae bajo P y P es ϕ-hereditario, entonces todo número finito cae bajo el concepto P. Para su infortunio, en 1902 Frege recibió una carta de Bertrand Russell en la que le comunicaba que su sistema de lógica tenía un grave defecto, pues en él era posible derivar contradicciones. Como ejemplo le mostró una paradoja que ahora lleva el nombre de su autor. Ésta resulta simplemente al formar, con base en el axioma de extensionalidad, la clase r = x̂(x ∈ / x) Con base en el axioma de comprensión para clases tenemos que ∀x(x ∈ r ⇔ x ∈ / x) en particular, r∈r⇔r∈ / r, lo cual constituye una contradicción. parte, Frege introduce estas nociones en forma verbal, siendo el uso de las distintas notaciones posterior a su obra. 3.3. L AS PARADOJAS O ANTINOMIAS 139 La carta de Russell llegó cuando el volumen II de los Grundgesetze estaba en prensa, por lo que Frege sólo pudo incluir un apéndice relativo a la paradoja. Sugirió entonces una modificación al axioma de extensionalidad, la cual probó ser insuficiente más adelante. En todo caso, el programa logicista de Frege se había fracturado, lo cual llevó a su autor al eventual abandono del proyecto. En la siguiente sección abordamos con cierto detenimiento el tema de las paradojas. 3.3. Las paradojas o antinomias La paradoja de Russell no fue el único problema que hubo que enfrentar con relación a los fundamentos de la matemática al inicio del siglo veinte. Por el contrario, veinticuatro siglos después de Zenón de Elea, la matemática pudo atestiguar una verdadera resurrección de las antinomias y las paradojas.12 Se trataba de un banquete en el que las viandas eran sutiles razonamientos que torturaban al entendimiento toda vez que éste intentaba ahondar en su sentido, de argumentos de simple apariencia que conducían a contradicciones. El problema era que la asistencia al banquete era forzosa para los matemáticos: por divertidas que parecieran, detrás de las antinomias había algo más que discusiones bizantinas, pues era la legitimidad del pensamiento matemático lo que se hallaba en el fondo del debate. En cierto sentido, las antinomias plantearon dos cuestiones que dieron lugar a grandes debates: ¿qué es eso de la verdad matemática?, ¿cómo eludir la amenaza que representan? En su momento, muchos sintieron la necesidad de responder a estas interrogantes, intentado, cada quien a su manera, ofrecer una respuesta en medio de un coro de voces discordantes. No sólo era que las antinomias confundían a la razón, sino que ésta no hallaba la manera de anular lo que ella misma había engendrado: había que idear un antídoto que las contrarrestara. Obviamente, en un espacio tan breve no podemos presentar un catalogo completo de las antinomias ni pasar lista a todos los remedios propuestos; más bien, nos limitaremos a enunciar las más significativas, hilvanando algunas reflexiones inevitablemente superficiales. A fin de cuentas, lo que nos interesa es el efecto que tuvieron en el 12 Literalmente, la palabra “antinomia” significa “en contra de la ley” o “contradicción entre los preceptos legales” y se le utiliza para indicar el hecho de que dos leyes o dos principios se contradicen. No obstante, en la lógica y las matemáticas tiene un uso más específico y designa una contradicción que inicia con el uso de la noción de todos. A las antinomias se les suele llamar eufemísticamente paradojas, como si sólo se tratara de una opinión contraria a la común, no de una contradicción. Fieles a la tradición, a menudo nos referiremos a las antinomias bajo el nombre genérico de paradojas, dado el fuerte arraigo que este uso tiene en el medio. Una antinomia lógica es un argumento en el que se presentan una proposición P y su negación ¬P con la propiedad de que una se sigue de la otra y viceversa, no habiendo manera de determinar cuál de ellas es verdadera. En general, cuando una proposición conduce a su contraria, se llega a la conclusión de que es falsa y se le rechaza. Pero si su negación conduce a su vez a la proposición original, por la misma razón se le debe rechazar, lo que va en contra del principio del tercero excluido y nos deja en medio de una dificultad. 140 3. L A CUESTIÓN DE LOS FUNDAMENTOS ... problema de los fundamentos y mirar desde esta perspectiva la solución propuesta por algunos de los matemáticos más influyentes en este dominio: Russell, Poincaré, Brouwer y Hilbert. Una ganancia adicional es que los teoremas limitativos de Gödel están inspirados en algunas de ellas, por lo que conviene mirarlas con un dejo de creatividad.13 Como el lector notará en lo que sigue, muchas paradojas nacieron en ocasión de la teoría de conjuntos, aunque no todas ellas toman en consideración conjuntos infinitos. Hay en ello una razón: algunos autores decidieron retocar algunas de ellas, que inicialmente trataban con conjuntos infinitos, para no salir del dominio de lo finito; su intención era mostrar que tales contradicciones no eran el resultado de hacer uso del infinito, sino que se debían a algo más fundamental, hasta alcanzar a la lógica. La paradoja de Burali-Forti. Aunque ya en 1895 Cantor había descubierto una antinomia en la teoría de conjuntos, el inicio de la nueva era de las paradojas se puede fechar en 1897, año en el que Cesare Burali-Forti (1861-1931) publicó un artículo titulado Una questione sui numeri transfiniti.14 Este trabajo se considera la señal de alarma contra los principios de la teoría de conjuntos (principalmente el principio de comprensión15 ), mostrando que encierran eso que los matemáticos consideran el peor de sus enemigos, una falta imperdonable: la contradicción. La explicación de la paradoja de Burali-Forti es simple aunque un tanto técnica. En la teoría intuitiva de conjuntos se consideraba lícito pensar en el conjunto Ω de todos los números ordinales, y razonar sobre él. Esto dio lugar al siguiente razonamiento: Dado que todo conjunto de números ordinales está bien ordenado, al conjunto Ω le corresponde un número ordinal α.16 Dicho ordinal tiene dos propiedades: es un elemento de Ω (pues Ω contiene a todos los ordinales) y es mayor que cualquier elemento de Ω, de donde se infiere que es mayor que él mismo: α < α. Esto último contradice el hecho de que α ≮ α algo que se demuestra en la teoría. Este resultado hizo ver, a pesar de su aparente naturalidad, que el principio de com13 Más allá de confundir a la razón, las paradojas permitieron probar lo erróneo de algunos principios y patrones de razonamiento, sugiriendo con ello un camino para probar imposibilidades. Inspirados en ellas los matemáticos han desarrollado ingeniosos métodos de prueba en dominios como el de los sistemas formales, los fundamentos de las matemáticas o la teoría matemática de la computabilidad. Como veremos, en la mayoría de los casos la paradoja se basa en lo que podemos llamar reflexividad o autorreferencia, un procedimiento que con el paso del tiempo se convirtió en una valiosa herramienta de trabajo, lo cual constituye una razón adicional para explorar este tipo de argumentos. 14 Cf. Burali-Forti, 1897. 15 El principio de comprensión lo podemos formular con cierto grado de imprecisión como sigue: Toda propiedad determina un conjunto, es decir, dada cualquier propiedad, existe un conjunto cuyos elementos son exactamente los objetos que la poseen. Esta idea está contenida en la versión que ofrece Cantor de un conjunto como cualquier reunión en un todo de objetos separados y bien definidos de nuestra intuición o nuestro pensamiento (pues dada una propiedad, nos es dado pensar en los objetos que la tienen). Asimismo, se halla en los Fundamentos de la aritmética de Frege, justo en la combinación del axioma de comprensión para propiedades y el axioma de extensionalidad (v. la sección 3.2). 16 Véase la parte final del apéndice F. 3.3. L AS PARADOJAS O ANTINOMIAS 141 prensión es una suposición inadmisible (es este principio lo que permite considerar conjuntos como Ω y otros que en seguida veremos). Como se puede ver, a Burali-Forti le bastó adaptar un razonamiento que Cantor había utilizado con éxito en la teoría de los números transfinitos al introducir, por ejemplo, objetos como el primer número ordinal transfinito ω –que resulta al considerar el conjunto de todos los números ordinales finitos–, o al construir la escala ilimitada de los aleph, todo ello sin incurrir en contradicciones. Pero cuando Burali-Forti consideró en su totalidad la serie bien ordenada de todos los números ordinales (y al decir todos nos referimos a que, por definición, no hay otros), el mismo procedimiento operativo dio lugar a un nuevo número ordinal, un número que no se halla en la totalidad de los números ordinales, que forma y no forma parte de esta totalidad. La paradoja de Cantor. Cantor descubrió en 1899 una antinomia semejante a la de Burali-Forti pero que tiene lugar en la teoría de los números cardinales. Considérese el conjunto de todos los conjuntos, digamos M. Por el teorema de Cantor, ℘(M) > M.17 No obstante, como todos los conjuntos pertenecen a M y ℘(M) es un conjunto de conjuntos, ℘(M) ⊂ M, de donde se sigue que ℘(M) ≤ M. Esto último contradice el hecho, demostrado en la teoría, de que si A ⊂ B, entonces no A > B. Por lo tanto, se tiene que ℘(M) > M y no ℘(M) > M, una contradicción. Al respecto, Cantor intentó eludir el problema separando las multiplicidades en dos clases: las consistentes y las inconsistentes, aduciendo que las segundas no son realmente conjuntos:18 Una multiplicidad puede estar constituida de modo tal que la hipótesis de una “existencia simultánea” de todos sus elementos conduce a una contradicción, de tal suerte que es imposible concebir esa multiplicidad como una unidad, “como un objeto acabado”. Tales multiplicidades yo las nombro multiplicidades absolutamente infinitas o inconsistentes. Por ejemplo, se podría uno persuadir fácilmente de que la “clase de todo lo que es pensable” es una multiplicidad tal; otros ejemplos se presentarán más adelante. Si por el contrario, la totalidad de los elementos de una multiplicidad puede pensarse como “existente simultáneamente” de tal manera que sea posible concebirla como “un solo objeto”, yo la nombro una multiplicidad consistente o un “conjunto” (en francés e italiano este concepto se expresa con precisión por lo vocablos “ensemble” e “insieme”).19 17 Véase el apartado Cardinales transfinitos superiores del apéndice F. como veremos, influyó de manera decisiva en la concepción que Hilbert tiene de la existencia matemática. 19 Cantor, carta a Dedekind, Halle, 28 de julio de 1899. Reproducida en Sestier, 1981, p. 92. 18 Esto, 142 3. L A CUESTIÓN DE LOS FUNDAMENTOS ... El inconveniente de esta solución es que remite a un problema de gran envergadura: al de la consistencia de una teoría para la que ni siquiera se tenía entonces un cuadro axiomático. Es claro que hay algo que no marcha bien en el modo en que Cantor asume la existencia de conjuntos y que podemos calificar de “ingenuo” (naif). La paradoja de Russell. Esta paradoja, que ya hemos presentado al final de la sección anterior, es sin lugar a dudas la antinomia más famosa de todas. Tiene varias virtudes: es extremadamente simple, impecable desde el punto de vista de la lógica y sólo recurre a la noción de pertenencia de un objeto a una clase (a diferencia de las anteriores, que apelan a diversas nociones de la teoría de los números transfinitos). Por ahora nos limitaremos a ofrecer algunos comentarios al respecto. Esta antinomia dio lugar a un ahondamiento en las investigaciones en torno a los principios de la matemática, y a la reorganización de la lógica hecha por Russell y Whitehead en Principia Mathematica (1910-13). Y si bien ésta se origina en una imposibilidad lógica (la fórmula que la expresa es una contradicción lógica: ∃x∀y(R(y, x) ⇔ ¬R(y, y))), tuvo la virtud de poner nuevamente en duda el principio de comprensión, uno de los puntales de la lógica clásica. Russell, quien dirigiera años después una verdadera fábrica de paradojas, elaboró algunas variantes de esta antinomia que tienen el valor de presentarse de una manera mucho más concreta y con un significado más accesible. He aquí algunas de ellas20 : La paradoja del barbero. En cierta población hay un barbero que afeita única y exclusivamente a aquellas personas del pueblo que no se afeitan a sí mismas. La pregunta es: ¿quién afeita al barbero? Otra variante es la siguiente: La paradoja del catálogo de los catálogos. Toda biblioteca que se respete tiene un catálogo en el que se enumeran los libros que contiene. Cuando dicho catálogo tiene la forma de un libro, es normal que se mencione a sí mismo como uno de los libros del acervo, aunque esto último no siempre sucede. En cierta ocasión, en la Biblioteca Nacional decidieron elaborar dos supercatálogos, uno que incluyera todos los catálogos que hacen referencia de sí mismos, y otro que incluyera todos los catálogos que no hacen referencia de sí mismos. Este último catálogo, ¿se menciona a sí mismo? La paradoja del alcalde. Todos los municipios de Holanda tienen un alcalde. A menudo, sucede que el alcalde no vive en el municipio que gobierna. En cierta ocasión era tal el número de alcaldes de esta segunda especie, que el parlamento holandés promulgó una ley ordenando la creación de un municipio donde vivirían única y exclusivamente aquellos alcaldes que no residieran en el municipio que presidían. La pregunta es: ¿dónde habría de vivir el alcalde de dicho municipio? Para mostrar que las antinomias se debían a algo más fundamental que el recurso al infinito y que éstas se podían formular con nociones extraídas de la lógica, Russell elaboró ex profeso la siguiente paradoja. 20 Cf. Russell, 1906. Si el lector así lo desea, puede omitir la lectura de las paradojas cuya relación aquí se inicia, salvo la de Richard, dada su importancia con relación al teorema de Gödel. 3.3. L AS PARADOJAS O ANTINOMIAS 143 La paradoja de la impredicabilidad. Una propiedad se dice que es predicable cuando se aplica a sí misma, e impredicable cuando no se aplica a sí misma. Por ejemplo, la propiedad “abstracto” es abstracta, y por tanto predicable. En cambio “concreto” es abstracto y, por tanto, impredicable. La pregunta es: la propiedad “impredicable”, ¿es impredicable? Una variante de esta paradoja es la siguiente: La paradoja de Grelling. Se dice que un adjetivo es autológico si la propiedad denotada por él es aplicable a él mismo; de lo contrario se dice que el adjetivo es heterológico. Por ejemplo, “polisílabo” es un adjetivo polisílabo y por tanto es autológico; en cambio, “monosílabo” no es un adjetivo monosílabo y por tanto es heterológico. La pregunta es: el adjetivo “heterológico”, ¿es heterológico? La paradoja de Berry.21 Consideremos la siguiente expresión: “el menor número natural que no se puede describir con menos de veintinueve sílabas”. Si contamos las sílabas de esta expresión podremos ver que tiene menos de veintinueve: el 1 des 15 me 2 nor 3 cri 16 bir 17 nú 4 con 18 me 5 me 19 ro 6 na 7 nos 20 tu 8 de 21 ral 9 que 10 no 11 se 12 pue 13 vein 22 ti 23 nue 24 ve 25 sí 26 de 14 la 27 bas 28 Hay en lengua castellana sólo un número finito de expresiones con menos de veintinueve sílabas. Por consiguiente, hay sólo un número finito de enteros positivos que se pueden describir con una expresión que tenga menos de veintinueve sílabas y habrá un entero k que sea el menor entero positivo que no se puede caracterizar de esa manera. No obstante, la expresión en cursivas describe al número k ¡con menos de veintinueve sílabas! La paradoja de Berry tiene dos virtudes: no va más allá de los números finitos y sólo recurre a la noción de definibilidad finita. Se trata de un caso simplificado de la más compleja antinomia de Richard que a continuación exponemos. La paradoja de Richard. Algunas frases de la lengua castellana definen propiedades de los números enteros. Por ejemplo, la frase “x no es divisible más que por él mismo y la unidad” define la propiedad de ser un número primo. Tales frases se pueden ordenar según su longitud (número de letras) y, si son de la misma longitud, alfabéticamente (a este tipo de orden se le llama lexicográfico). Representemos por D1 (x), D2( x), . . . , Dn (x), . . . tal ordenación. Decimos que un número k es richardiano si Dk (k) es falso, y no richardiano si Dk (k) es verdadero. Como la definición de número richardiano la hemos dado en lengua castellana, le corresponde un lugar en la lista. Supongamos que éste es el r-ésimo lugar ¿es r un número richardiano o no 21 Siguiendo a Bertrand Russell, quien en el artículo previamente citado de 1906 la atribuye a G. G. Berry, un bibliotecario de la universidad de Oxford. 144 3. L A CUESTIÓN DE LOS FUNDAMENTOS ... richardiano? Si r es richardiano, entonces Dr (r) es falso (por definición de richardiano) y r es no richardiano (pues no cumple con la definición Dr (x)). Por el contrario, si r es no richardiano, entonces Dr (r) es verdadero (por definición de no richardiano) y r es richardiano (pues cumple con Dr (x) que define tal propiedad). Por tanto, r es richardiano si y sólo si r no es richardiano, una contradicción. Como a continuación mostramos, esta paradoja utiliza, además de las nociones de verdad y definibilidad, el método de la diagonal de Cantor. Dispónganse las definiciones y los números naturales en un arreglo bidimensional (una matriz infinita) como en el siguiente diagrama. D1 (x) D2 (x) D3 (x) ... Dn (x) ... 1 D1 (1) D2 (1) D3 (1) ... Dn (1) ... 2 D1 (2) D2 (2) D3 (2) ... Dn (2) ... 3 D1 (3) D2 (3) D3 (3) ... Dn (3) ... ... ... ... ... ... ... ... n D1 (n) D2 (n) D3 (n) ... Dn (n) ... ... ... ... ... ... ... ... En el renglón superior se enumeran los números naturales y en la columna a la izquierda todas las definiciones de propiedades de los números naturales. Para cada n y cada k, en la intersección de la fila n con la columna k se escribe el enunciado que afirma que el número k tiene la n-ésima propiedad, es decir, el enunciado Dn (k). V. gr., en la intersección (2, 3) figura el enunciado D2 (3). La definición de número richardiano resulta al recorrer el arreglo a lo largo de la diagonal, pues en ella se pide que el enunciado Dk (k) sea falso: una aplicación del método de la diagonal de Cantor (véase la sección 2.6.3). Como veremos, hay una similitud estructural entre el argumento de Richard y el argumento que Gödel utiliza para demostrar la existencia de proposiciones indecidibles en la aritmética formal. Más allá del carácter polémico de las antinomias y de las dificultades ocasionadas por ellas a los distintos programas de fundamentación de la matemática, Gödel descubrió que éstas encerraban la clave para poner al descubierto la disparidad entre dos nociones que hasta entonces se habían confundido: las nociones de verdad y de demostrabilidad.22 Comentario Final. Como el lector habrá notado, no todas las antinomias son de la misma especie: unas recurren sólo a nociones lógicas, otras a nociones conjuntistas, algunas apelan a nociones semánticas como la de verdad, otras recurren a la noción de infinito y otras más evitan esta noción a toda costa. Obviamente, su “grado de resolubilidad” no es el mismo. Por ejemplo, la paradoja del barbero lo único que 22 Como anticipo podemos decir lo siguiente: partiendo de la paradoja de Richard, Gödel reemplaza la condición “el enunciado Dk (k) es falso” por la condición “la fórmula φk (k) no es demostrable” y explora qué consecuencias tendría el hecho de que una fórmula perteneciente a una teoría axiomática formalizada definiera esta propiedad, para después construir una fórmula semejante. 3.3. L AS PARADOJAS O ANTINOMIAS 145 demuestra es la imposibilidad de que haya en cualquier lugar una persona con las características indicadas. Y si bien algo semejante sucede con la paradoja de Russell, en el sentido de que no puede existir tal cosa como el conjunto de todos los conjuntos que no se pertenecen a sí mismos, ésta deja tras de sí el problema de hallar un sustituto del principio de comprensión, de muy fácil aceptación y uso generalizado en la matemática, y algo peor: la desconfianza en los métodos utilizados. Por su parte, las paradojas de Berry y de Richard remiten a un problema de gran importancia para la lógica moderna: el de la distinción entre lenguaje y metalenguaje.23 Hilbert fue quizá el primero en llamar la atención sobre este punto al elaborar su programa de fundamentación. Aun así, casi todas las paradojas tienen algo en común: la autorreferencia o reflexibidad. Cada una de ellas expresa algo de todos los casos de un género y a partir de esta expresión surge un nuevo caso que es y no es similar a aquellos a los que el “todos” se refiere. Así, por ejemplo, la propiedad de no pertenecerse a sí mismo, aplicable a todos los conjuntos, da lugar al conjunto de todos los conjuntos que no se pertenecen a sí mismos, un nuevo caso que es y no es similar a los demás conjuntos de este género (pues se pertenece y no se pertenece a sí mismo). Se trata de una autorreferecia evidente. Como veremos, ante esta dificultad Russell optó finalmente por establecer reglas dirigidas a impedir la autorreferencia de la que nacen las paradojas, mientras que Hilbert insistió en la vía axiomática y las pruebas de consistencia como única solución; Brouwer, en cambio, pidió la exclusión del infinito actual y del principio del tercero excluido como único remedio. Epílogo. Originada a comienzos del siglo veinte, la polémica en torno a las antinomias de la teoría de conjuntos ha perdido mucha de su agudeza. Algunas cuestiones se han resuelto, otras se han esclarecido, y más que nada el interés de los matemáticos y filósofos se ha desplazado a otros problemas. Si bien su importancia con relación al problema de los fundamentos no se puede negar, en algunos casos ésta se ha sobrestimado, llegándose incluso a hablar de una “crisis en los fundamentos”, como si en verdad se tratara de un período en el que el edificio matemático hubiera estado a punto de derrumbarse o la actividad matemática se hubiera paralizado en espera de una solución. Nada más alejado de la realidad. Por ejemplo, Hilbert, después de bosquejar un programa para demostrar la consistencia absoluta de los axiomas de la aritmética, dirigió sus esfuerzos a las ecuaciones integrales y a la física, donde se mantuvo por más de 12 años, mostrando en ello una actitud similar a la de otros matemáticos. Incluso Zermelo, que siguió trabajando en la teoría de conjuntos, no pareció preocuparse mayormente por este problema y se limitó a ofrecer una base axiomática para la teoría, suficiente al menos para las necesidades del matemático activo. Claro está que no todos reaccionaron igual. Por el contrario, hubo un sector de estudiosos que, trabajando en torno al problema de los fundamentos desde una perspectiva más cercana a la filosofía, reaccionaron con desenfreno ante las antinomias al ver cómo 23 Véase al respecto el apéndice N. 146 3. L A CUESTIÓN DE LOS FUNDAMENTOS ... se derrumbaba su proyecto: nos referimos a Frege y Russell. A su vez, otros pensadores optaron por reconstruir el edificio entero, aislando en las zonas inciertas un núcleo esencial y echando por la borda todo lo que no se pudiera justificar sobre una base intuitiva o empírica. En esta corriente se inscriben Poincaré, Borel, Lebesgue y Baire.24 Lejos de la especulación filosófica, su meta era establecer qué objetos y métodos debían considerarse como válidos en la matemática. Más tarde Brouwer se habría de incorporar a esta tendencia, aunque de una manera mucho más sistemática y cercana a la filosofía, principalmente a la de Kant. Proclamándose él mismo heredero del empirismo francés, Brouwer subió a la palestra en 1907, ocasionando su intervención una serie de eventos asociados directamente con el retorno de Hilbert al debate sobre los fundamentos hacia 1917: había que restituir la certeza de la matemática sin renunciar a sus conquistas. En efecto, para Borel y Lebesgue, lo mismo que para Brouwer y Hermann Weyl (éste último, discípulo de Hilbert), la reconstrucción de la matemática habría de empezar en la teoría del continuo, de la que surgen los materiales de que están hechos los principales objetos del análisis matemático tradicional, y continuar en la teoría de conjuntos. Hilbert se opuso a tal empresa, en la medida en que implicaba la supresión de sectores considerables en ambas teorías. Su plan era el opuesto: conservar el edificio intacto. En cuanto al impacto e importancia de las antinomias en la matemática propiamente dicha, en el apéndice G hemos incluido un análisis de su efecto y algunas medidas que se tomaron ante ellas. 3.4. La propuesta de Hilbert de 1904 Hilbert retomó el tema de la consistencia de los axiomas para la aritmética en 1904, cuatro años después de haber incluido el problema en su famosa lista de 1900. A la sazón la situación difería en un punto muy importante de la que prevalecía cuando axiomatizó la geometría. En aquel momento nadie dudaba de la consistencia de los axiomas, de manera que la prueba ofrecida por Hilbert en los Grundlagen parecía más bien una fineza antes que la respuesta a un problema acuciante. Pero cuando las críticas a la matemática clásica se acrecentaron en voz de matemáticos como Poincaré, Hilbert sintió la imperiosa necesidad de garantizar la consistencia del sistema de los números reales, base del análisis matemático. En particular, esta solución sería una refutación del punto de vista de Kronecker, según el cual los números irracionales no son objetos matemáticos legítimos. Retomando el lenguaje de Cantor (véase el comentario que sigue a su antinomia en la sección anterior), lo que Hilbert buscaba era demostrar que la multiplicidad de los números reales era una multiplicidad consistente, lo cual, conforme a lo que hemos visto, garantizaría su existencia matemática.25 24 Ya nos hemos referido anteriormente a algunos de estos matemáticos, cuyos comentarios respecto al axioma de elección los podrá encontrar el lector en la sección 2.6.5. 25 Al respecto, el método de construcción genética de los números reales ya no era viable como criterio de existencia, pues en él concurrían distintas nociones conjuntistas puestas en duda por las antinomias. 3.4. L A PROPUESTA DE H ILBERT DE 1904 147 Fue entonces que Hilbert concibió la idea de investigar la demostración matemática. Había que ensayar nuevos caminos antes que restringir los conceptos y los métodos de esta disciplina como quería Kronecker. Al igual que Cantor, Hilbert considera que uno de los principales atributos de la matemática es su libertad, y vio en las restricciones impuestas a la noción de número un mal, una limitación inaceptable. Su propósito era eliminar las paradojas sin cometer traición contra su ciencia. Y frente a la idea de Kronecker de que todo ha de ser reducible a la noción de número entero, Hilbert insistió en que la noción de número real es una libre creación del espíritu humano que puede y debe tener un fundamento. Estas ideas las presentó en el Tercer Congreso Internacional de Matemáticas celebrado en la ciudad de Heidelberg. Transcurría el año de 1904.26 Y si bien el proyecto debió esperar algunos años para madurar, en sus reflexiones ya asomaba las ideas que conformarían lo que sería su programa para fundamentar la matemática, una de las cuales reviste especial importancia para nosotros: que fuera la matemática misma la encargada de resolver el problema de sus fundamentos. La necesidad de este cambio de dirección en las investigaciones obedeció a la naturaleza misma del problema. Dice al respecto: Mientras que en la actualidad estamos esencialmente de acuerdo en cuanto a los caminos a seguir y las metas por alcanzar cuando se trata de investigar los fundamentos de la geometría, la situación es muy distinta con relación a la pregunta por el fundamento de la aritmética; aquí, los investigadores sostienen una gran variedad de opiniones incompatibles. De hecho, algunas de las dificultades en los fundamentos de la aritmética son de una naturaleza diferente de aquellas que debieron ser superadas cuando se establecieron los de la geometría. Al examinar los fundamentos de la geometría nos fue posible hacer a un lado ciertas dificultades de naturaleza puramente aritmética; pero el recurso a otra disciplina primordial no parece estar permitido cuando es el fundamento de la aritmética lo que está en juego.27 A fin de precisar su punto de vista, Hilbert somete a una revisión crítica diversos puntos de vista, manifestando de paso su sentir respecto a la cuestión de los fundamentos. En la mayoría de los casos califica la tendencia considerada otorgándole un nombre y Había, pues, que proceder de otra manera, al margen de los métodos de razonamiento habituales en la teoría de los números irracionales. Esta necesidad de probar la consistencia de la matemática clásica se hizo más evidente para Hilbert cuando Zermelo presentó sus axiomas para la teoría de conjuntos, los cuales incluían el controvertido axioma de elección (v. la sección 2.6.5). 26 Tras el congreso, Hilbert se distanció del problema de los fundamentos en parte porque sus intereses lo condujeron en otra dirección (la física matemática), y en parte —-por lo menos así se especula-— porque no encontró una manera eficaz de llevar a cabo la proyectada prueba. No fue sino hasta 1917 que retomó estas cuestiones. 27 Hilbert, 1904. Cita tomada de Heijenoort, 1967, p. 130. 148 3. L A CUESTIÓN DE LOS FUNDAMENTOS ... atribuyéndola a alguna persona. Así, por ejemplo, habla del dogmatismo de Kronecker, del empirismo de Helmoltz, del oportunismo de Christoffel, del subjetivismo de Cantor y del método trascendental de Dedekind. No hace ninguna mención de Russell, pero sí de Frege, de quien dice que ha sido “uno de los académicos que ha ahondado con mayor profundidad en la esencia de los enteros.”28 Es a este pensador a quien dedica el mayor de los comentarios, reconociendo lo meritorio de su obra: G. Frege se asigna la tarea de establecer las leyes de la aritmética con los procedimientos de la lógica, tomada en el sentido tradicional. [...] Pero, fiel a su plan, acepta entre otras cosas el principio fundamental de que un concepto (un conjunto) está definido y es utilizable de inmediato si para cada objeto está determinado si éste se subsume o no en el concepto, y en ello no impone ninguna restricción a la noción de “cada”. De este modo, queda expuesto precisamente al tipo de paradojas teórico-conjuntistas contenidas, por ejemplo, en la noción del conjunto de todos los conjuntos, lo cual muestra, así me parece, que las concepciones y los medios de investigación prevalecientes en la lógica, tomada en su sentido tradicional, no están a la altura de las demandas de rigor que nos impone la teoría de conjuntos. Más bien, desde un principio una de las principales metas en las investigaciones de la noción de número debería ser evitar tales contradicciones y clarificar tales paradojas.29 Tras señalar algunos puntos de desacuerdo con Dedekind y Cantor, afirma que la noción de numero no se puede fundamentar únicamente en la lógica, sino en el proceder axiomático: “Soy de la opinión de que todas las dificultades señaladas se pueden superar y que podemos procurar un fundamento riguroso y completo a la noción de número con un método que yo llamaría axiomático y cuya idea fundamental quiero desarrollar brevemente en lo que sigue.”30 A lo cual añade: A menudo la aritmética se considera parte de la lógica y usualmente las nociones lógicas fundamentales se presuponen cuando se trata de suministrar un fundamento a la aritmética. No obstante, si observamos con atención, nos damos cuenta de que en la exposición tradicional de las leyes de la lógica se utilizan ciertas nociones aritméticas fundamentales como, por ejemplo, la noción de conjunto y, en cierta medida, también la de número. Nos hallamos así dando vueltas en círculo y es por ello que se requiere un desarrollo en parte simultáneo de las leyes de la lógica y de la aritmética, si es que se han de evitar las paradojas.31 28 Hilbert, ibid. ibid. El principio fundamental al que Hilbert se refiere es el principio de comprensión ampliamente comentado en las secciones 3.2 y 3.3. 30 Hilbert, op. cit., p. 131. 31 Hilbert, ibid. Hilbert mantuvo durante (casi) toda su vida la opinión de que la aritmética no se 29 Hilbert, 3.4. L A PROPUESTA DE H ILBERT DE 1904 149 Hilbert dedica el resto de la conferencia a exponer la forma en que piensa llevar a cabo esta tarea, una cuestión que esbozaremos en la siguiente sección. La labor requería de un análisis detallado de los métodos de demostración que intervienen en las teorías matemáticas y que Hilbert no estaba en posibilidades de llevar a cabo en ese momento.32 No obstante, en su proyecto se vislumbran dos ideas que nunca habría de abandonar. Son las siguientes: 1. Que la única manera de resolver en definitiva el problema de la consistencia de la aritmética es sometiendo a un examen minucioso la estructura demostrativa de la teoría, a fin de probar que con los axiomas y métodos de demostración admitidos es imposible demostrar proposiciones contradictorias entre sí.33 2. Que la base segura para el pensamiento matemático es la intuición del signo.34 Aunque esto no lo dice explícitamente en este trabajo, en sus consideraciones está presente la idea de que la intuición sensible constituye una base segura para investigar la demostración matemática una vez que ésta se organice como un arreglo de fórmulas. Como veremos, más adelante haría de esta facultad el baluarte de las pruebas de consistencia. Aunque a la sazón Hilbert estaba muy lejos de alcanzar su objetivo y los recursos disponibles eran escasos (aún había que forjar las herramientas necesarias para alcanzar la meta), en sus reflexiones asoma la postura que tiene ante la matemática y sus fundamentos: el rechazo de toda suposición metafísica acerca de la naturaleza de los objetos matemáticos, la negativa a renunciar a las conquistas de la matemática moderna (en especial a la teoría de conjuntos), una fe irrestricta en el poder de la razón, la búsqueda de una solución matemática al problema de los fundamentos y el recurso a la formalización. puede fundamentar en la lógica, no sólo porque considera que esta última presupone desde un principio algunas nociones aritméticas, sino porque juzga, en aparente conformidad con Kant, que en la base del pensamiento matemático se halla una forma de pensamiento intuitivo que procede sin presupuestos de ninguna especie y que es irreductible a la lógica (siendo ésta una de las razones por las que propone el desarrollo simultáneo de ambas disciplinas). A esta cuestión habremos de volver más adelante. 32 En efecto, dadas las exigencias del problema, para llevar a buen término esta investigación era necesario refinar el método axiomático más allá de lo logrado en los Grundlagen der Geometrie, pues la matemática usual, en la que las proposiciones se presentan bajo una extraña mezcla de lenguaje ordinario y lenguaje simbólico y en la que las demostraciones no tienen una estructura bien definida que facilite su análisis, no se prestaba para esta tarea. 33 Es decir, habría que dejar de lado el método de los modelos que tan buenos dividendos le había producido en la geometría y llevar a cabo una prueba referente a las demostraciones. Como más adelante lo reconocería Hilbert, esto requiere de un segundo nivel de consideración, es decir, de una “teoría matemática acerca de la estructura y funcionamiento de las teorías matemáticas” que habría de denominar metamatemática y cuya conformación debió esperar hasta 1922. 34 Es decir, nuestra capacidad para captar y reconocer de inmediato los signos y sus formas, las diferencias entre ellos y su posición espacial con relación a los otros signos (cuando son escritos). De esto hablaremos en detalla más adelante, sobre todo en la sección 4.3. En ello Hilbert muestra las raíces kantianas de su filosofía. 150 3. L A CUESTIÓN DE LOS FUNDAMENTOS ... Para que algunas de estas ideas llegaran a madurar debieron pasar algunos años y muchos otros acontecimientos, como el desarrollo del programa logicista de Russell y Whitehead, la resurrección de las ideas de Kronecker, las continuadas críticas de Poincaré (heredero del empirismo francés) y la aparición en la escena de Brouwer y Weyl con sus ideas constructivistas. Mientras tanto, Hilbert postergaría el problema de los fundamentos para atender otra de sus predilecciones: la física matemática. Cerramos esta sección con dos comentarios. 1. Aunque Hilbert jamás volvió a su plan de 1904 para probar la consistencia de la aritmética, queremos mostrar brevemente el tipo de ideas que éste encerraba. Grosso modo, el plan consistía en reconstruir la teoría aritmética como un sistema simbólico (que no sintáctico) y probar que las fórmulas iniciales tenían cierta propiedad (la de ser homogéneas, noción que aquí no detallaremos), para después probar que esta propiedad se transmitía con la deducción lógica, es decir, que era “hereditaria” en el sentido de que a partir de fórmulas homogéneas sólo se podían derivar fórmulas homogéneas.35 En tal caso la prueba de consistencia se lograría al comprobar que la negación de una fórmula homogénea no lo es, lo que equivaldría a demostrar que a partir de los axiomas no se podían derivar contradicciones.36 2. En la propuesta de Hilbert se advierte la intención de resolver el problema de los fundamentos de la matemática desde el interior de la matemática misma, sin necesidad de adherirse del todo a alguno de los grandes esquemas filosóficos a la mano como lo eran el racionalismo, el realismo conceptual, el idealismo trascendental, el positivismo, el empirismo, etc., aunque se nutre de algunos de ellos. Si bien en su concepción asoman principalmente elementos tomados del empirismo y de la filosofía de Kant, no podemos dejar de reconocer que éstos los toma fragmentadamente, de acuerdo a sus necesidades, y sin abrazar la totalidad de sus principios. Por ejemplo, en los escritos de Hilbert no hay ninguna referencia a la lógica trascendental de Kant, sino sólo a la analítica y a la estética, y esto de manera restringida. Simplemente toma lo que considera pertinente y desecha o evita lo demás. 35 En el trabajo de 1904 esto sólo lo logra para un fragmento muy simple de la aritmética. En cuanto a la noción de “homogeneidad”, tenemos dos razones para no insistir en ella: primero, que para nosotros lo importante de la propuesta de Hilbert no es la forma específica en que piensa llevar a cabo la prueba de consistencia, sino las ideas que lo guían y que más tarde afinará en lo que será su programa de fundamentación de la matemática clásica; la segunda razón es que Hilbert nunca volvió a esta noción. 36 Quizá un símil nos ayude. Supongamos que una investigación revela dos hechos sorprendentes: que Adán y Eva efectivamente existieron y tenían los ojos negros. Supongamos además que en el estudio se descubre que la pigmentación de sus ojos se debe a un gen superdominante que se transmite de manera infalible, en el sentido de que si alguno de los progenitores de un individuo tiene los ojos negros a causa del gen, el individuo forzosamente tendrá los ojos negros y el mismo gen. Esto probaría que los individuos que no tienen los ojos negros no son descendientes de Adán y Eva, ni siquiera de alguno de los dos. La analogía, aunque no es exacta, aclara a la perfección lo que Hilbert tenía en mente al presentar su plan: si la negación de una fórmula derivable fuera a su vez derivable, tendría que ser homogénea. 3.4. L A PROPUESTA DE H ILBERT DE 1904 151 En todo caso, es a sus propios colegas a quienes Hilbert quiere convencer de la solidez del edificio matemático, haciéndoles ver que no es necesario recurrir a ningún sistema extraño a su disciplina. A su vez, considera que la naturaleza del pensamiento matemático se verá aclarada a tal punto que el problema de los fundamentos quedará resuelto para siempre. Como veremos, esta actitud se agudizó con el paso del tiempo, hasta llegar al extremo de creer que como un resultado del análisis de la estructura deductiva de la matemática clásica obtendría un método general para resolver en principio cualquier problema matemático. Por otra parte, no deja de ser sorprendente el hecho de que una postura tan cautelosa respecto a la epistemología y la ontología matemáticas culminara en un ambicioso proyecto que sólo lo pudieron frenar las investigaciones de Gödel, Turing y Church. Como quiera que sea, después de la intervención de Hilbert la discusión sobre los principios y los fundamentos de la matemática ya no pudo volver al estado en que se hallaba a comienzos del siglo veinte. Algunas de las ideas prevalecientes en ese momento las examinaremos en lo que resta de este capítulo. Por ahora sólo queremos advertir al lector que al leerlo deberá tener presente que uno de nuestros propósitos es mostrar cómo fue que Hilbert extendió su concepción de la matemática teniendo como punto de partida lo que podríamos llamar “la visión de un matemático activo”. No sin cierta arrogancia, lo que procura es dotar a esta disciplina de un sólido fundamento sin siquiera salir de ella, escribiendo de este modo el primer capítulo de lo que podríamos llamar una filosofía matemática. 3.4.1. La aritmética como un sistema de fórmulas Para concluir este apartado queremos comentar brevemente el modo específico en que Hilbert intenta reconstruir la aritmética como un sistema simbólico. Ya en 1900 Hilbert había llevado el punto de vista axiomático al ámbito de los números reales: Un sistema de objetos en el que las relaciones entre ellos están gobernadas por los axiomas, y para el que sólo son verdaderas aquellas proposiciones, y sólo aquellas, que se puedan derivar a partir de ellos mediante un número finito de inferencias lógicas.37 El intento de 1904 se centra en la aritmética de Peano, e incorpora la idea de tratar las proposiciones como meras expresiones simbólicas. Esto no lo logra plenamente. Por ejemplo, Hilbert no especifica el conjunto de símbolos primitivos o las reglas de construcción de fórmulas, y deja abierto el problema de los métodos de inferencia admisibles, con lo que el sistema queda muy lejos de cumplir los estándares modernos que él mismo impusiera años después a los sistemas sintácticos. No obstante, en dicho trabajo ya asoma la idea de no recurrir en ningún momento al significado que 37 Véase Problemas Matemáticos, conferencia pronunciada ante el pleno del 2o Congreso Internacional de Matemáticas en la ciudad de París en 1900. 152 3. L A CUESTIÓN DE LOS FUNDAMENTOS ... pudieran tener los símbolos, limitando toda consideración al manejo combinatorio de los mismos. Otro punto de interés de la propuesta de Hilbert es que se trata de la primera investigación destinada a desarrollar simultáneamente la lógica y la matemática. Esto implicaría el manejo enteramente formal de las operaciones lógicas, en el que los operadores de conjunción, negación, etc. no tienen ningún significado. Si bien el sistema de Hilbert no corresponde exactamente a la noción de un cálculo lógico (por las razones ya señaladas en el párrafo anterior), en él ya se encuentra la idea de un sistema simbólico en el que las consecuencias de los axiomas se pueden derivar mediante procedimientos mecánicos. Este aspecto ya lo había vislumbrado Poincaré en 1902 con relación a los Grundlagen der Geometrie.38 Al respecto, lo hecho por Hilbert en 1904 se asemeja más bien a un cálculo de ecuaciones rudimentario. Abundando en sus limitaciones podemos decir que en él nada hay que se acerque a una teoría formal de la cuantificación, habiendo poca claridad en el manejo de las variables y las proposiciones cuantificadas. No fue sino hasta después del trabajo de Russell en Principia Mathematica que Hilbert encontró el camino correcto. Hilbert inicia la exposición del sistema invitándonos a considerar un objeto cualquiera de nuestro pensamiento (en sus palabras; una cosa del pensamiento [Gedankeding]) que servirá como un símbolo inicial y al que denotará con 1 (uno). Esto obedece a la intención de introducir el símbolo “1” de la manera más abstracta posible, sin suponer ninguna semántica para él. Lo mismo se puede decir de los otros cuatro símbolos “primitivos” que utiliza: = (igualdad), u (conjunto infinito), f (sucesor) y f (operación acompañante). Es combinando estas cosas como obtiene lo que serían las fórmulas del sistema, entre las que se encuentran ciertas entidades que, grosso modo, corresponden a igualdades numéricas de la forma x = y. Todo esto es muy vago y no vale la pena intentar dilucidarlo aquí. Por ejemplo, el lenguaje simbólico no incluye variables, y para la negación no hay un operador dentro del sistema; en vez de ello, introduce un símbolo externo ā que correspondería a la proposición “a no es una entidad válida”. De la misma manera, la noción de implicación lógica la representa mediante una expresión de la forma “A|B”, donde A y B son proposiciones, sin que el símbolo “|” pertenezca al sistema. De los cuantificadores ni hablar. Con base en este simbolismo Hilbert introduce cinco esquemas axiomáticos que corresponden, grosso modo, a los axiomas para la igualdad de Leibniz (dos de ellos) y 38 En una reseña de los Grundlagen publicada en 1902, Poincaré destaca un aspecto de la formalización que nadie había notado con anterioridad: el de poder desarrollarse con la ayuda de una máquina: “Así, el Sr. Hilbert ha buscado, por decirlo de alguna forma, poner los axiomas bajo una forma tal que puedan ser aplicados por alguien que no comprende su sentido, y que nunca hubiera visto ni puntos, ni rectas, ni planos. Después de él, los razonamientos deben poderse someter a reglas puramente mecánicas, y para hacer geometría es suficiente con aplicar servilmente estas reglas a los axiomas, sin saber qué es lo que quieren decir.” [Poincaré, 1902] De hecho, Poincaré sugiere darle las reglas a una máquina razonadora como, por ejemplo, el piano lógico de Jevons y ver si se puede obtener toda la geometría. Aquí el punto es precisamente que el sistema de Hilbert de 1904 aún no alcanza dicho nivel de desarrollo (no se han especificado las reglas lógicas), aunque apunta fuertemente en esa dirección. 3.5. L A TEORÍA AXIOMÁTICA DE Z ERMELO -F RAENKEL 153 a los tres primeros axiomas de Peano para la aritmética de los números naturales. Lo hecho por Hilbert en 1904 constituye la antesala de los sistemas formales, los cuales tienen una definición tan precisa que hace posible un estudio riguroso de sus propiedades estructurales. Esta posibilidad trajo a colación la cuestión de los métodos utilizados por Hilbert al investigar el sistema. Al respecto, Poincaré sostiene que dicho estudio encierra un círculo vicioso, pues presupone el conocimiento de los números naturales. En otras palabras, Poincaré dice que la prueba de consistencia que ofrece Hilbert para un fragmento de la aritmética se sirve de aquello mismo que quiere fundamentar, lo cual la invalida en tanto que recurso de fundamentación. En la sección 3.6 habremos de volver a este punto. Para concluir diremos que el intento de Hilbert destaca no por los logros obtenidos, sino por la originalidad de sus ideas. No obstante, dadas las exigencias del problema, para llevar a buen término esta clase de investigaciones era necesario refinar el método axiomático más allá de lo logrado en el texto de 1904, pues si bien en él ya se tiene la idea de un lenguaje simbólico carente de significado, las demostraciones aún no poseen una estructura bien definida que facilite su análisis. En cuanto al propósito de no asumir nada como conocido, pronto veremos lo que Poincaré tiene que decir al respecto. 3.5. La teoría axiomática de Zermelo-Fraenkel El tratamiento que da Cantor a la teoría de conjuntos es enteramente intuitivo e informal: maneja los conjuntos como objetos del pensamiento ordinario y se deja llevar por el sentido común en sus argumentos, sin detenerse a examinar sus principios. De hecho, juzga que la noción básica de la teoría, la de conjunto o agregado (Menge), no es susceptible de un análisis matemático exhaustivo. El tratado Beirtrage zur Begründung der transfiniten Mengenlehere(I) (Contribuciones al fundamento de la teoría de conjuntos (I)) de 1895,39 quizá la mejor presentación que Cantor hiciera de su teoría, comienza con la siguiente ‘definición’, ya expuesta en la sección 2.6: “Por un conjunto [Menge] hemos de entender cualquier reunión en un todo M de objetos definidos y distintos de nuestra intuición o nuestro pensamiento.”40 Para todo fin práctico, la definición anterior es un adorno inoperante, y no ocupa ningún lugar en la teoría. En esto la situación es análoga a la de las definiciones euclidianas de punto, línea, etc. que no desempeñan ningún papel en el despliegue de la geometría y que, al parecer, fueron incluidas con el único propósito de sugerir qué es lo que se pretende significar con tales términos en el discurso. Además, un atento examen de la definición deja ver que en ella se hace referencia de manera implícita a una facultad especial –al entendimiento, que realiza el acto reunir los objetos en un todo– la cual se debe evitar cuando lo que se busca es incorporar la noción a una teoría formal. Esto motivó 39 Cantor 40 Cantor 1895. 1955, p. 85. 154 3. L A CUESTIÓN DE LOS FUNDAMENTOS ... que la definición de Cantor fuera reemplazada por el principio de comprensión.41 Este principio apareció por primera vez en el volumen 1 de los Grundgesetze der Arithmetik de Frege, publicado en 1893, y fue utilizado con algunas modificaciones por Russell y Whitehead (1861-1947) en Principia Mathematica.42 En su teoría, Zermelo presenta este principio con algunas restricciones dándole el nombre de axioma de separación. Aunque Zermelo ya se había apoyado en algunos axiomas en la demostración del teorema del buen orden (como, por ejemplo, el de elección), no fue sino hasta 1908 que presentó una lista de axiomas para la teoría de conjuntos. Para entonces la disciplina ya había alcanzado la madurez suficiente como para reconocer en ella un reducido número de principios que servirían como base en su reconstrucción axiomática, muy en el espíritu de Hilbert en los Grundlagen. Esto lo hizo en un escrito titulado “Untersuchungen über die Grundlagen der Mengenlehre, I” (Investigaciones en torno a los fundamentos de la teoría de conjuntos I) en el que propuso sus célebres axiomas para la teoría de conjuntos. El artículo inicia con las siguientes palabras: La teoría de conjuntos es una rama de las matemáticas cuya tarea es investigar las nociones fundamentales de “número”, “orden” y “función” tomándolas en su forma primitiva y más simple, y desarrollar a partir de ellas los fundamentos lógicos de toda la aritmética y todo el análisis; de este modo se constituye en una componente indispensable de la ciencia matemática. No obstante, en la actualidad la existencia misma de esta disciplina parece estar amenazada por ciertas contradicciones, o “antinomias”, que se pueden derivar de sus principios —-que, al parecer, gobiernan necesariamente nuestro pensamiento—- y para las que no se ha encontrado una solución enteramente satisfactoria. En particular, en vista de la “antinomia de Russell” del conjunto de todos los conjuntos que no se contienen a sí mismos como elementos, hoy en día parece inaceptable seguir asignando a cualquier noción lógicamente definible un conjunto, o clase, como su extensión. La definición original de Cantor de un conjunto como “una reunión en un todo de objetos definidos y distintos de nuestra intuición o nuestro pensamiento” requiere, por lo tanto, de algunas restricciones; al presente, la definición dada por Cantor no se ha podido reemplazar con éxito por otra igual de simple y que no dé lugar a tales dudas. Bajo tales circunstancias, en este momento no tenemos ninguna 41 Este principio, al que ya hemos hecho referencia, establece que toda propiedad (predicado en la lógica moderna) determina un conjunto formado por todos los términos que la poseen. Como ya lo hemos dicho, esta idea corresponde a la noción de clase que utilizan Frege y Russell, y a la idea de extensión de los conceptos de la lógica tradicional. 42 En Principia Mathematica se define clase como “todos los objetos que satisfacen una función proposicional.” [Russell y Whitehead, 1910, p. 23]. Para formar una clase ya no se trata de reunir objetos en el entendimiento, sino de reunir los valores a de la variable x que figura en una función proposicional P(x) para los que la proposición P(a) es verdadera. ¿Con qué clases se cuenta? eso depende del tipo de funciones proposicionales que se consideren admisibles. En gran medida, Principia Mathematica se puede contemplar como un examen crítico de las reglas que hay que imponer a la formación de funciones proposicionales a fin de cerrarle el paso a clases como la de la antinomia de Russell. 3.5. L A TEORÍA AXIOMÁTICA DE Z ERMELO -F RAENKEL 155 alternativa que no sea la de proceder en la dirección contraria y, tomando como punto de partida la teoría de conjuntos dada históricamente, buscar los principios requeridos para establecer las bases de esta disciplina matemática. Al resolver el problema debemos, por una parte, restringir los principios lo suficiente como para excluir todas las contradicciones y, por la otra, tomarlos lo suficientemente amplios como para retener todo lo que hay de valor en la teoría. En este trabajo me propongo mostrar cómo la teoría creada por Cantor y Dedekind se puede reducir, en su totalidad, a unas cuantas definiciones y principios, o axiomas, que parecen ser independientes entre sí. La ulterior y más filosófica pregunta por el origen y la validez de estos principios no será examinada aquí. Ni siquiera he podido demostrar rigurosamente que mis axiomas son consistentes, aunque esto es algo esencial; en vez de ello, me limito a señalar aquí y allá que las antinomias descubiertas hasta ahora desaparecen de una vez por todas si se adoptan como base los principios propuestos. No obstante, espero haber hecho alguna labor preparatoria para subsiguientes investigaciones en torno a problemas de tal profundidad.43 El pasaje merece algunos comentarios. 1. El trabajo de Zermelo se adhiere directamente a la empresa axiomática de Hilbert, de modo que su propósito no es establecer un conjunto de principios verdaderos, indemostrables y mejor conocidos que aquello que se infiere a partir de ellos, y que habrían de sustentar la verdad de la teoría; más bien, se trata de principios que permiten reconstruir la teoría en tanto que sistema hipotético-deductivo para así resaltar su estructura lógica. 2. La teoría axiomática es a su vez una definición implícita de las nociones de conjunto y pertenencia a un conjunto, que ya no dependen de su contenido intuitivo. En esto la situación sería enteramente análoga a la de las nociones y relaciones geométricas en el caso de los Grundlagen der Geometrie de Hilbert, ampliamente referida en el capítulo 1. Por tanto, la axiomatización de Zermelo cae dentro del marco conceptual señalado en la sección 1.6.3. 3. Si bien Zermelo está consciente de la amenaza que representan las antinomias de la teoría de conjuntos, su propósito al axiomatizar la teoría no es tanto responder al peligro que éstas representan, como un intento por reconstruir la matemática clásica en su totalidad al interior de la teoría de conjuntos, evitando a su vez las paradojas que nos obligan a restringir la noción de conjunto. En otras palabras, su idea es preservar la matemática clásica –a esto es a lo que se refiere cuando habla de “retener todo lo que hay de valor en la teoría”– ofreciendo a su vez una base segura que evite los problemas derivados de las paradojas. Esto no es lo 43 Zermelo, 1908a. Tomado de Heijenoorth 1967, pp. 201-202. 156 3. L A CUESTIÓN DE LOS FUNDAMENTOS ... mismo que reconstruir la matemática como una disciplina dentro de la lógica, como pocos años después lo intentarían Russell y Whitehead.44 No se trata, pues, de reducir la teoría a otra más vasta y profunda, sino de reconstruirla de modo que el matemático activo se sienta seguro en ella. Como veremos, en la teoría de Zermelo los conjuntos no se consideran como engendrados por propiedades (predicados), sino que, conforme al espíritu de la nueva axiomática, se les postula directamente como entidades primitivas que satisfacen ciertos axiomas que los definen implícitamente. Por ejemplo, uno de sus axiomas establece que a cada objeto corresponde un conjunto cuyo único elemento es dicho objeto, otro dice que los subconjuntos de un conjunto dado forman a su vez un conjunto (existencia del conjunto potencia), etc. Lo que importa es garantizar la existencia, en el sistema abstracto, de aquellos conjuntos que han probado ser relevantes para la práctica matemática. Así, en la teoría de Zermelo la noción de conjunto permanece indefinida, y lo único que se sabe de los “conjuntos” es lo que “dicen” los axiomas, los cuales describen su comportamiento y la forma en que se les ha de tratar matemáticamente. La exposición axiomática comienza con las siguientes palabras:45 a) La teoría de conjuntos se ocupa de un dominio B de individuos a los que llamaremos simplemente objetos y entre los que se hallan los conjuntos. Si dos símbolos a y b denotan al mismo objeto, escribimos a = b, y de lo contrario a = b. Decimos que un objeto a “existe” si pertenece al dominio B; de la misma manera, dada una clase A de objetos, decimos que “existe un objeto en la clase A” si el dominio B contiene un objeto de esta clase. b) Entre los objetos del dominio B prevalecen ciertas relaciones fundamentales de la forma a ∈ b. Si para dos objetos a y b se cumple la relación a ∈ b, decimos que “a es un elemento de b”, o que “b contiene al elemento a”. Salvo por una sola excepción (axioma II), se dice que un objeto b es un conjunto si y sólo si contiene otro objeto, a, como elemento. c) Si todo elemento de un conjunto M también es elemento de un conjunto N, de modo que de x ∈ M siempre se sigue que x ∈ N, decimos que M es un subconjunto de N y escribimos M ⊆ N. Siempre sucede que M ⊆ M, y de M ⊆ N y N ⊆ R siempre se sigue que M ⊆ R. Dos conjuntos M y N se dice que son ajenos entre sí si no tienen ningún elemento en común, o si ningún elemento de M es elemento de N. d) Una cuestión o aserción C se dice que es definida cuando las relaciones fundamentales del dominio determinan, sin arbitrariedad alguna, si ésta se cumple o no por medio de los axiomas y las leyes universalmente válidas 44 Zermelo no afirma que la noción de número se reduce a la de conjunto, como lo hacen Frege, Russell y Whitehead, sino que en la teoría de conjuntos se puede desarrollar satisfactoriamente la aritmética en tanto que teoría matemática, cosa muy distinta. 45 Hemos modificado la notación para ajustarla al uso actual. 3.5. L A TEORÍA AXIOMÁTICA DE Z ERMELO -F RAENKEL 157 de la lógica. De igual forma, una “función proposicional” [Klassenaussage] P(x), en la que el término variable x varía sobre todos los individuos de una clase A, se dice que es definida si lo es para cada individuo particular x de la clase A. Así, la cuestión de si a ∈ b o a ∈ b siempre es definida, al igual que la cuestión de si M ⊆ N o no.46 Los axiomas de Zermelo son siete: I (Axioma de extensionalidad) Si todo elemento de un conjunto M es también un elemento de un conjunto N, y viceversa, y, por lo tanto, M ⊆ N y N ⊆ M, entonces M = N. En breve, todo conjunto está determinado por sus elementos. II (Axioma de los conjuntos elementales) Existe un conjunto (impropio), el conjunto nulo, ∅, que no contiene ningún elemento.47 Si a es un objeto del dominio, existe un conjunto {a} que contiene a a y sólo a él como elemento; si a y b son dos objetos del dominio, siempre existe un conjunto {a, b} que contiene como elementos a a y b y a ningún otro objeto x distinto de ellos.48 III (Axioma de separación) Si una función proposicional P(x) es definida para los elementos de un conjunto M, entonces M tiene un subconjunto MP que contiene como elementos precisamente a aquellos elementos de M para los que P(x) es verdadera. IV (Axioma del conjunto potencia) A todo conjunto T le corresponde un conjunto PT , el conjunto potencia de T , que contiene como elementos precisamente a todos los subconjuntos de T . V (Axioma de la unión) A cada conjunto T le corresponde un conjunto ∪T , la unión de T , que contiene como elementos a los elementos de los elementos de T . VI (Axioma de elección) Si T es un conjunto cuyos elementos son conjuntos diferentes de ∅ y mutuamente ajenos entre sí, la unión ∪T incluye al menos un subconjunto S que tiene un único elemento en común con cada elemento de T . También podemos expresar el axioma diciendo que siempre es posible elegir un único elemento de cada conjunto M, N, . . . de T y combinar todos estos elementos en un conjunto S. VII (Axioma del conjunto infinito) Existe en el dominio al menos un conjunto Z que contiene al conjunto vacío como elemento y que está constituido de modo que a cada uno de sus elementos a corresponde un elemento de la forma 46 Zermelo, 1908a. La cita se tomó de Heijenoort, 1967, p. 201. español decimos conjunto vacío. 48 Antes de enunciar el axioma, Zermelo hace la observación de que el conjunto que sólo contiene a los elementos a, b, c, . . . , r se suele denotar con {a, b, c, . . . , r}. 47 En 158 3. L A CUESTIÓN DE LOS FUNDAMENTOS ... {a}, es decir, que para cada uno de sus elementos a, también contiene como elemento al conjunto {a}.49 Zermelo dedica el resto del artículo a discutir en detalle la equipotencia de conjuntos, mostrando que la teoría de los números cardinales de Cantor se sigue de los siete axiomas precedentes. La elaboración de una base axiomática para la teoría de los conjuntos de Cantor no concluyó con el trabajo de Zermelo. No obstante, antes de considerar algunos hechos sucedidos en el terreno de la exposición axiomática de la teoría, queremos señalar diversos aspectos que consideramos relevantes de la teoría axiomática de Zermelo, muchos de los cuales se relacionan directamente con el desarrollo ulterior de la lógica matemática y con la teoría de la demostración, una disciplina creada por Hilbert a fin de investigar el problema de la consistencia de las teorías axiomáticas. La numeración de los comentarios continúa a partir de los precedentes. 4. Zermelo expone su teoría en el marco del lenguaje ordinario, antes que en el más preciso lenguaje de la lógica simbólica ya conocido en aquel momento. En esto su presentación se asemeja a la que Hilbert hiciera de la geometría nueve años atrás. Una consecuencia de ello es que la noción de propiedad definida no es clara, pues no hay un criterio para decidir si una propiedad arbitraria es o no definida; es más, en el contexto del lenguaje natural sería difícil encontrar un criterio para determinar cuáles frases (aserciones) expresan propiedades de los objetos del dominio B y cuáles no. A esto habremos de volver en el inciso (7). 5. El axioma III es más débil que el principio cantoriano que afirma que toda propiedad concebible da lugar a un conjunto, y también que el principio de comprensión. Zermelo simplemente afirma que toda propiedad definida “adecuadamente” separa un conjunto MP a partir de un conjunto dado M, cuyos elementos ya están dados con anterioridad. De este modo evita intencionalmente la construcción de conjuntos como el de Russell, cuyos elementos se definen en términos del conjunto mismo. En particular, con base en la idea de que la propiedad x ∈ / x es definida, Zermelo prueba que el dominio B no es un conjunto. 6. El axioma VII de Zermelo garantiza la existencia en B de un conjunto infinito Z0 con elementos ∅, {∅}, {{∅}}, etc. que no se puede alcanzar con los otros axiomas a partir del conjunto vacío, único objeto cuya existencia está asegurada incondicionalmente por los demás postulados. Este conjunto Z0 sirve como representación del conjunto 0, 1, 2, . . . de los números naturales en la teoría axiomática. 7. El sistema de Zermelo fue la base del trabajo posterior en la teoría axiomática de conjuntos, y con el paso del tiempo experimentó diversos cambios y mejoras 49 Los axiomas fueron tomados de Heijenoort, 1967, pp. 201-204 con algunas modificaciones, sobre todo en la notación. 3.5. L A TEORÍA AXIOMÁTICA DE Z ERMELO -F RAENKEL 159 hasta alcanzar un cierto estándar de rigor muy distinto al primigenio. En este sentido, uno de los defectos de la presentación original era que la noción de propiedad definida era más bien vaga e imprecisa, por lo que en 1922 Toralf Skolem (1887-1963) propuso fijar la noción reemplazando el lenguaje ordinario con un lenguaje simbólico apropiado, e identificar las propiedades definidas con las fórmulas que se pudieran construir a partir de las formas básicas a ∈ b y a = b mediante las operaciones lógicas de negación (no, ¬), conjunción (y, ∧), disyunción (o, ∨), implicación (→), equivalencia (↔), cuantificación universal (para todo x, ∀x) y cuantificación existencial (existe x, ∃x). En otras palabras, las propiedades definidas serían aquellas propiedades de los conjuntos que se pudieran expresar mediante una fórmula obtenida a partir de fórmulas básicas (de la forma a ∈ b ó a = b) mediante la aplicación reiterada de los operadores lógicos ¬, ∧, ∨, ←, ↔, ∀ y ∃. Esto implicaba, entre otras cosas, la necesidad de recurrir a un lenguaje formal en la teoría. Esto nos lleva al último tema que habremos de abordar en esta sección. Como acabamos de ver, la necesidad de precisar la noción de propiedad definida implicó la introducción de lenguajes formales gobernados por reglas de construcción sintáctica muy estrictas. Tales lenguajes ya se conocían desde tiempo atrás, siendo quizá el más adecuado para tales fines el de Russell y Whitehead en Principia Mathematica. Entre 1922 y 1951 fueron exploradas diversas extensiones, modificaciones y alternativas del sistema de Zermelo tomando en consideración el uso de tales lenguajes. Los creadores de estas teorías fueron Abraham Fraenkel, John von Neumann, Paul Bernays, Kurt Gödel y Willard Van Orman Quine. De todas ellas, la más utilizada en la práctica matemática es la Teoría Axiomática de Conjuntos de Zermelo-Fraenkel, o ZF, que resulta de la teoría de Zermelo mediante la modificación y adición de algunos axiomas, y de la introducción de un lenguaje más preciso. En lo que sigue sólo nos ocuparemos de esta teoría, exponiendo sus axiomas en su forma moderna. A diferencia de la manera usual de presentar una teoría axiomática en matemáticas, en la que sólo se enumeran los términos indefinidos y los axiomas, la más rigurosa exposición formal requiere además explicitar los símbolos con que se construye el lenguaje, y las reglas con que se componen los enunciados de la teoría. Como veremos, por estricto que parezca este modo inicial de proceder, resulta insuficiente ante los requisitos que Hilbert impone a las pruebas de consistencia, según los cuales también es menester especificar los axiomas lógicos y las reglas de inferencia mediante las cuales se derivan los teoremas de la teoría. Símbolos. Los símbolos se clasifican en varias categorías, según su función. Constantes: ∅ (conjunto vacío). Variables: x0 , y0 , z0 , . . .; x1 , y1 , z1 , . . .; xn , yn , zn , . . .; . . . Relaciones: ∈ (pertenencia) Lógicos: ¬ (no), ∧ (y), ∨ (o), → (implica), ↔ (equivalente), ∀ (para todo), ∃ (existe), 160 3. L A CUESTIÓN DE LOS FUNDAMENTOS ... = (igual) Puntuación: ) [paréntesis derecho], ( [paréntesis izquierdo]. Fórmulas. Las reglas para construir fórmulas son muy simples. Se comienza por definir lo que es una fórmula básica (o atómica) y después una fórmula compuesta (o molecular). Básicas. Si a y b son el símbolo ∅ o alguna variable, entonces a ∈ b y a = b son fórmulas básicas o atómicas. Compuestas. Si φ y ψ son fórmulas y x es una variable, entonces son fórmulas (compuestas, o moleculares): ¬φ , (φ ∧ ψ), (φ ∨ ψ), (φ → ψ), (φ ↔ ψ), ∀xφ y ∃xφ Llamemos LZF a este lenguaje. Una propiedad de conjuntos es definida si existe una fórmula de LZF que la define o expresa, es decir, si la propiedad se identifica con alguna fórmula construible en este lenguaje. Aunque los medios expresivos de LZF parecen muy limitados, su poder es suficiente como para expresar y desarrollar en él casi todas las nociones y demostraciones importantes de la teoría de conjuntos, e incluso de la matemática clásica. Por ejemplo, la noción de subconjunto no es necesario representarla mediante un símbolo especial “⊆”, pues se le puede definir como sigue: x ⊆ y ≡de f ∀z(z ∈ x → z ∈ y) de modo que la expresión “x ⊆ y” siempre se puede reemplazar por la expresión a la derecha, que sí forma parte del lenguaje. Así, “x ⊆ y” no es sino una abreviatura de una fórmula del lenguaje y siempre se le puede eliminar en favor de esta última, un tanto más compleja en su escritura. De la misma manera se pueden introducir símbolos para la unión, la intersección o la diferencia de dos conjuntos, o para el conjunto potencia, los cuales son en cierto sentido superfluos, pues siempre se pueden reemplazar por fórmulas en las que las únicas relaciones que figuran son la pertenencia “∈” y la igualdad “=” que, por cierto, también se puede definir como sigue: x = y ≡de f ∀z(z ∈ x ↔ z ∈ y) (dos conjuntos son iguales cuando tienen los mismos elementos).50 Podemos ahora escribir los axiomas de Zermelo en este lenguaje como sigue: 1. (Axioma de extensionalidad) ∀x∀y(∀z(z ∈ x ↔ z ∈ y) ↔ x = y) 2. (Axiomas de los conjuntos elementales) 50 Si bien el símbolo “=” se puede introducir como un símbolo definido, se le suele incluir entre los símbolos primitivos en virtud de que, en general, la relación de igualdad se considera básica o inicial. 3.5. L A TEORÍA AXIOMÁTICA DE Z ERMELO -F RAENKEL 161 a) ∀x¬(x ∈ ∅) (conjunto vacío) b) ∀x∃y∀z(z ∈ y ↔ z = x) (conjunto cuyo único elemento es x) c) ∀x∀y∃z∀w(w ∈ z ↔ (w = x ∨ w = y)) (conjunto cuyos únicos elementos son x e y) 3. (Axioma de separación) ∀x∃y∀z(z ∈ y ↔ (z ∈ x ∧ P(z)) donde P(z) es una fórmula de L (es decir, hay un axioma para cada fórmula P) 4. (Axioma del conjunto potencia) ∀x∃y∀z(z ∈ y ↔ ∀w(w ∈ z → w ∈ x)) 5. (Axioma de la unión) ∀x∃y∀z(z ∈ y ↔ ∃w(z ∈ w ∧ w ∈ x)) Para escribir en forma legible el axioma de elección es necesario introducir algunos símbolos especiales, es decir, algunas abreviaturas. Denotamos con ∪a al conjunto unión de a (cuya existencia está asegurada por el axioma 5, de modo que b ∈ ∪a ≡de f ∃x(x ∈ a ∧ b ∈ x); asimismo, denotamos con a ∩ b al conjunto intersección de a con b, de modo que c ∈ (a ∩ b) ≡de f (c ∈ a ∧ c ∈ b). La existencia de este último conjunto está asegurada por los axiomas 2.c, 5 y 3 tomando a (z ∈ a ∧ z ∈ b) como la fórmula P(z). 6. (Axioma de elección) ∀x((¬(x = ∅) ∧ ∀y(y ∈ x → ¬(y = ∅))∧ ∀y∀z((y ∈ x ∧ z ∈ x ∧ ¬(y = z)) → y ∩ z = ∅)) → (∃z(z ⊆ ∪x ∧ ∀w(w ∈ z → ¬(z ∩ w = ∅)∧ ∀u∀v(u ∈ (z ∩ w) ∧ v ∈ (z ∩ w) → u = v))))). Aunque complicada, esta fórmula expresa exactamente la propiedad enunciada por el axioma de elección. Los dos primeros renglones establecen las condiciones generales: x es un conjunto no vacío cuyos elementos son conjuntos no vacíos y ajenos entre sí; el tercer renglón asienta que la unión ∪x incluye al menos un subconjunto z que tiene un único elemento en común con cada elemento de x, mientras que el cuarto renglón señala que dicho elemento es único. Para escribir en forma inteligible el axioma del conjunto infinito es necesario introducir un símbolo especial para el conjunto cuyo único elemento es x (cuya existencia está asegurada por el axioma 2.b; denotemos con {x} a este conjunto. 7. (Axioma del conjunto infinito) ∃x(∅ ∈ x ∧ ∀y(y ∈ x → {y} ∈ x). Este axioma garantiza la existencia de un conjunto con una infinidad de elementos, pues el conjunto cuya existencia se afirma contiene a la sucesión (infinita) de conjuntos disjuntos ∅, {∅}, {{∅}}, {{{∅}}}, . . . 162 3. L A CUESTIÓN DE LOS FUNDAMENTOS ... Esta teoría axiomática se representa con las siglas ZE o ZC por "Zermelo con el axioma de elección".51 En 1922 Skolem y Fraenkel sugirieron sendos axiomas que permitían probar que ciertas colecciones de conjuntos como, por ejemplo, {ω,℘(ω),℘(℘(ω)), . . . , ℘n (ω), . . .},52 eran a su vez conjuntos, cosa que no se podía lograr en ZC. En 1928 von Neumann presentó una versión modificada de estos axiomas, conocida como axioma del reemplazo, la cual dice escuetamente que si cada elemento de un subconjunto de un conjunto dado se encuentra asociado a un conjunto, entonces la colección de los conjuntos asociados es ella misma un conjunto. Volviendo a nuestro ejemplo, si tomamos como conjunto inicial a ω, el conjunto de los ordinales finitos, y como conjunto asociado a cada n ∈ ω al conjunto ℘n (ω), entonces la colección ω1 = {ω,℘(ω),℘(℘(ω)), . . . ,℘n (ω), . . .} es un conjunto. 8. (Axioma del reemplazo) ∀x∀y∀z(x ∈ a ∧ R(x, y) ∧ R(x, z) → y = z) → ∃b∀y(y ∈ b ↔ ∃x(x ∈ a ∧ R(x, y)) La hipótesis del axioma pide que la relación R sea una función (es decir, que con cada elemento de a esté asociado a lo más un conjunto). El nombre del axioma obedece a la siguiente idea que se encuentra detrás de él: si se tiene una fórmula R(x, y) con la propiedad de que para cada x en un conjunto a hay a lo más una y tal que R(x, y), entonces podemos decir que tales “y” forman un conjunto b y “reemplazar” a a con b. Este axioma es más poderoso que el axioma de separación (axioma 3), que se sigue de él. La teoría axiomática constituida por los axiomas 1-8 se conoce como teoría de los conjuntos de Zermelo-Fraenkel con axioma de elección, y se suele denotar con las siglas ZFC. Si se omite el axioma 6 (axioma de elección), la teoría resultante se denomina teoría axiomática de conjunto de Zermelo-Fraenkel, y se escribe ZF. Comentario final. Hemos apenas señalado algunos aspectos de la teoría de conjuntos de Zermelo-Fraenkel que, junto con los axiomas de Peano para la aritmética elemental, constituye una de las teorías axiomáticas más reconocidas en la matemática moderna. A pesar de su brevedad, esperamos que esta presentación sea de utilidad, sobre todo tomando en cuenta las siguientes observaciones. 1. La doble exposición de la teoría axiomática permite contrastar lo que es una presentación informal, a la manera de la geometría de Hilbert, de una presentación rigurosa, que incluye la introducción de un lenguaje formal definido con todo 51 ZC se debe a que en inglés el axioma de elección se conoce como “axiom of choice”. Dado el uso frecuente de estas siglas para referirse a la teoría, a menudo nos referiremos a ella siguiendo esta costumbre. 52℘n (ω) significa ℘(℘(. . .℘(ω) . . .)) donde la operación de tomar el conjunto potencia se reitera n veces. 3.6. P OINCARÉ , W EYL Y EL PREDICATIVISMO 163 rigor. Éste es un paso importante en el proyecto de Hilbert para fundamentar la matemática y un elemento clave en la demostración de los teoremas de Gödel, como se podrá ver en el capítulo 5. 2. Como ya lo hemos señalado, ZFC es suficientemente poderosa como para reconstruir en ella el edificio entero de la matemática clásica. En particular, es posible desarrollar en su interior la aritmética recursiva, un fragmento de la aritmética en cuyo interior Gödel construye sus argumentos. Esto hace que el sistema ZF esté sujeto a las limitaciones que imponen los teoremas de Gödel. Como veremos, para elaborar la prueba de Gödel es necesario contar con una descripción más precisa del sistema axiomático, especificando las reglas de inferencia y los principios (axiomas) lógicos que se aceptan como válidos en la teoría. Este paso, que no dimos en esta presentación de ZF, es irrelevante cuando se trabaja en el contexto de la matemática ordinaria.53 De hecho, ningún matemático activo desarrolla su trabajo teórico de esa manera, y si lo hace es porque su interés se centra en la teoría misma, no en los objetos que trata de conocer a través de ella. En este sentido, la única razón para proceder con extremo rigor es porque el objeto de estudio son los recursos demostrativos de la teoría. Por ejemplo, un estudio de tal naturaleza en el campo de la aritmética no tendría como propósito conocer las propiedades de los números, sino los procesos mediante los cuales se demuestran los teoremas que enuncian la propiedades de los números, algo que cae dentro del campo de la lógica, no de la aritmética (por lo menos, eso es lo que uno pensaría antes de estudiar a Gödel). Algo semejante podemos decir de la óptica oftálmica, que no se ocupa de los objetos que podemos conocer mediante la vista, sino del proceso de visión en el ojo. 3.6. Poincaré, Weyl y el predicativismo 3.6.1. Poincaré La postura de Henri Poincaré respecto a la naturaleza de la matemática es la opuesta a la de Frege: ve en las proposiciones aritméticas juicios sintéticos a priori, mientras que en los principios de la geometría ve simples hipótesis adoptadas por conveniencia, lejos del apriorismo kantiano. Estas ideas las expone en diversos ensayos publicados entre 1887 y 1910 en los que aborda, de manera poco sistemática y en tono polémico, distintas cuestiones relativas a los fundamentos de la matemática. Poincaré confronta por igual a logicistas, formalistas y cantorianos sin a veces distinguir claramente entre ellos. Frente al logicismo de Frege y Russell argumenta que la aritmética es irreductible a la lógica, pues esta última tan sólo consiste en un sistema 53 La presentación de la teoría axiomática de Zermelo-Fraenkel como sistema formal la damos en el apéndice Ñ, después de introducir el concepto de sistema formal en el apéndice L. 164 3. L A CUESTIÓN DE LOS FUNDAMENTOS ... de verdades analíticas, mientras que la primera, originada en la intuición, contiene proposiciones sintéticas cuya invención requiere de creatividad e imaginación, algo que la lógica no nos puede dar. Esto lo expresa en un ensayo relativo al papel de la lógica y la intuición con las siguientes palabras: En nuestros razonamientos creemos ya no apelar a la intuición, aunque los filósofos nos dicen que esto es una ilusión. La lógica pura no nos llevará jamás a otra cosa que a tautologías; no podrá crear nada nuevo; de ella por sí sola no puede salir ninguna ciencia. [. . . ] Para edificar la aritmética [. . . ] hace falta otra cosa que la lógica pura. Para designar esta otra cosa no tenemos otra palabra que intuición.”54 Más adelante afirma: “Así, la lógica y la intuición desempeñan cada una un papel necesario. Ambas son indispensables. La lógica, que sólo puede dar certeza, es el instrumento de la demostración. La intuición es el instrumento de la invención.” Esta postura concuerda con su vida matemática, donde no gustaba del rigor excesivo. Poincaré sostiene que en el punto de partida de la aritmética se halla una clara comprensión intuitiva del sistema de los números naturales, de la cual emana el principio de inducción completa. En su opinión las nociones aritméticas básicas no son reducibles, ni lo necesitan, a algo más simple, lo cual marca un rotundo rechazo a la reducción lógica que buscan Frege y Russell, a la deducción trascendental de Dedekind y al fundamento axiomático de Peano y Hilbert. Entre otras cosas aduce que todo intento por referirlas a algo más simple implica una petición de principios. Por ejemplo, sostiene que la prueba de consistencia ofrecida por Hilbert en 1904 para un fragmento de la aritmética encierra un círculo vicioso, pues en su argumento se sirve del razonamiento por recurrencia y, por ende, de la noción intuitiva de número natural.55 Ergo la supuesta reducción axiomática, cuyo fundamento sería la prueba de consistencia, encierra una petición de principios que la invalida. Por otra parte, ve en la argumentación por recurrencia (basada en el principio de inducción) el verdadero razonamiento matemático, aquello que evita que la matemática sea una inmensa tautología y la causa de que ésta sea irreducible a la lógica. Dice al respecto: El carácter esencial del razonamiento por recurrencia es que contiene, por decirlo de algún modo, una infinidad de silogismos condensados en una única fórmula. Para que nos podamos dar cuenta de ello, voy a enunciar uno tras otro estos silogismos que están, si se me permite la expresión, dispuestos en cascada. Bien entendidos se trata de silogismos hipotéticos. [. . . ] El teorema es cierto para el número 1. Y si es cierto para el 1, es cierto para el 2; luego es cierto para el 2. Pero si es cierto para el 2, es cierto para el 3; luego es cierto para el 3; y así sucesivamente.56 54 Poincaré, 1900, p. 121. Poincaré 1908, Libro 2, Cap. 3, Sección II. 56 Poincaré, 1894, pp. 379-380. 55 V. 3.6. P OINCARÉ , W EYL Y EL PREDICATIVISMO 165 En distintos lugares Poincaré subraya el carácter creativo del principio de inducción, el cual nos ha permitido conocer la verdad de muchas proposiciones universales, sintéticas y a priori, que forman parte de la matemática. Por el contario, en el terreno de la geometría rechaza el apriorismo kantiano, adhiriéndose al convencionalismo. Esto lo expresa con las siguientes palabras: “Los axiomas geométricos no son ni juicios sintéticos a priori, ni hechos experimentales. Son convenciones. Nuestra elección, entre todas las convenciones posibles, está guiada por los hechos experimentales, pero sigue siendo libre y no está limitada más que por la necesidad de evitar toda contradicción.”57 En su opinión, si los axiomas de la geometría fueran intuiciones a priori, estos se impondrían a nosotros con tal fuerza que no podríamos concebir las proposiciones contrarias (v. gr., la negación del quinto postulado de Euclides), ni levantar sobre ellas un edificio teórico. Ahora veamos con cierto detenimiento sus opiniones respecto de Hilbert. 3.6.2. Poincaré ante el formalismo de Hilbert y la teoría de Cantor En general Poincaré muestra una buena opinión en torno a los Grundlagen der Geometrie de Hilbert. Por ejemplo, manifiesta cierta complacencia con la idea de presentar las nociones y expresiones básicas de la geometría plana (punto, línea, pasar por, estar entre, etc.) no como algo destinado a suscitar imágenes geométricas, sino como algo que puede designar indistintamente objetos y relaciones de una naturaleza cualquiera: He aquí las reflexiones que nos deben inspirar estos enunciados [los axiomas]: las expresiones “estar situado en, pasar por”, etc. no están destinadas a evocar imágenes; son simplemente sinónimos de la palabra determinar. Las palabras “punto, recta y plano” no deben provocar en el espíritu alguna representación sensible. Ellas podrían designar indiferentemente objetos de una naturaleza cualquiera, con la provisión de que uno pueda establecer entre tales objetos una correspondencia tal que a todo sistema de dos objetos llamados puntos corresponda un objeto llamado línea.58 Es entonces que escribe las palabras ya citadas en la sección 3.4.1 y que aquí repetimos por comodidad: [. . . ] Así, el Sr. Hilbert ha buscado, por decirlo de alguna forma, poner los axiomas bajo una forma tal que puedan ser aplicados por alguien que no comprende su sentido, y que nunca hubiera visto ni puntos, ni rectas, ni planos. Después de él, los razonamientos deben poderse someter a reglas puramente mecánicas, y para hacer geometría es suficiente con aplicar servilmente estas reglas a los axiomas, sin saber qué es lo que quieren decir. 57 Poincaré, 58 Poincaré, 1891. 1902a, p. 252. 166 3. L A CUESTIÓN DE LOS FUNDAMENTOS ... [. . . ] Esta es la misma preocupación que ha inspirado a ciertos sabios italianos, los señores Peano y Padoa, quienes se han esforzado por crear una “pasigrafía”, es decir, una especie de álgebra universal en la que todos los razonamientos se reemplazan por símbolos o por fórmulas. Esta preocupación puede parecer artificial y pueril, [. . . ] pero en el caso del Sr. Hilbert ésta se explica y se justifica si uno recuerda el propósito que persigue.59 Poincaré ve con complacencia lo que Hilbert hace en geometría en virtud de que en su opinión, como ya lo hemos señalado, toda teoría geométrica se basa en convenciones, no en principios ciertos. Dichas convenciones pueden presentarse como sea, sin necesidad de explicar sus términos o el significado de sus axiomas. Tras un largo análisis de los Grundlagen der Geometrie, Poincaré termina diciendo que con sus novedosas concepciones, Hilbert ha producido en la filosofía de las matemáticas un progreso comparable al que debemos a Lobachevsky, Riemann, Helmholtz y Lie. Poco tiempo después no habría de decir nada parecido con relación a los fundamentos de la aritmética. Al comentar la obra de Louis Couturat, un logicista francés, objeta la afirmación que éste hiciera en el sentido de que con su trabajo, Russell y Peano dieron fin al debate entre Leibniz y Kant, demostrando que en la aritmética no hay juicios sintéticos a priori y que la matemática es reducible a la lógica. Se pregunta si eso es realmente posible: “Eso que ha hecho Hilbert para la geometría, otros lo han querido hacer para la aritmética y el análisis. Incluso si hubieran tenido un éxito total, ¿estarían los kantianos condenados al silencio? Puede ser que no, pues al reducir la matemática a una forma vacía se le mutila.”60 Poincaré no está dispuesto a renunciar a aquello que, según él, da vida a la matemática, haciendo de ella no sólo una ciencia, sino un arte. Es entonces que el formalismo de Hilbert le parece fuera de lugar. Al referirse a la idea de Frege y Russell de desarrollar la aritmética como parte de la lógica, se pregunta: “Pues bien, lo que quiero averiguar es si es verdad que una vez admitidos los principios de la lógica se puede, no digo descubrir, sino demostrar todas las verdades matemáticas, sin llamar de nuevo a la intuición.”61 Esta interrogante también atañe a Hilbert, quien intenta edificar la aritmética sobre un cuadro de axiomas que, en principio, habrían de implicar todas las propiedades de los números naturales. Ante tal posibilidad Poincaré imagina lo contrario: la imposibilidad de establecer un cuadro axiomático completo para la aritmética, señalando con ello un problema que no habría de resolverse sino hasta 1930 con las investigaciones de Gödel. Con relación a la teoría de conjuntos, el ataque de Poincaré se apoya en una idea totalmente opuesta a la de Cantor en cuanto al modo de ser de los objetos matemáticos. 59 Ibid. Años más tarde habría de decir algo semejante: “¿Qué son estas cosas? No solamente no sabemos nada, sino que tampoco debemos tratar de saberlas. No tenemos necesidad, y cualquiera que no hubiera visto jamás ni un punto, ni una línea, ni un plano, podría hacer tanta geometría como hacemos nosotros. De esta manera, para demostrar un teorema no es útil ni necesario lo que quiere decir.” (Poincaré 1908, p. 114). 60 Poincaré, 1908, Libro 2, Cap. 3, Sección II. 61 Poincaré 1908, Libro 2, Cap. 3, Sección II. 3.6. P OINCARÉ , W EYL Y EL PREDICATIVISMO 167 Según Poincaré, todas las nociones matemáticas se forman en la mente humana a partir de lo dado en la intuición, o se obtienen a partir de ese tipo de nociones mediante definiciones explícitas. Asociadas a lo anterior se encuentran dos ideas: que los objetos matemáticos no tienen una existencia propia, platónica, y que no existen totalidades infinitas acabadas. De ello concluye que los principios de la teoría cantoriana no se pueden justificar de ninguna manera, pues su validez tiene como condición tal modo de existencia. En un pasaje afirma: “No hay infinito actual; los cantorianos lo han olvidado y han caído en contradicción:”62 La afirmación anterior se apoya en la opinión de que las antinomias son el resultado de aplicar la cuantificación universal a conjuntos infinitos, dando lugar con ello a falsas definiciones. En efecto, al analizar las paradojas de la teoría de conjuntos Poincaré parte de la idea de que toda noción matemática que no derive llanamente de la intuición se ha de introducir mediante una definición explícita. Esto lo lleva a examinar los distintos tipos de definición de uso en la matemática y a proscribir las definiciones impredicativas (o no predicativas), en las que un objeto se define haciendo referencia a una totalidad a la que dicho objeto pertenece. Argumenta que en tales casos el definiens no es anterior al definiendum, pues el segundo forma parte del primero.63 Ve en ello un círculo vicioso y la “creación” de tal objeto a través de la definición. Esta idea se halla en la base del llamado predicativismo, del cual nos ocuparemos en la siguiente sección. Un punto importante con relación a Poincaré es que jamás elaboró sus ideas de manera sistemática. Por ejemplo, nunca dijo nada acerca del lenguaje en el que habrían de escribirse las proposiciones y las definiciones matemáticas, ni expresó ningún comentario acerca de la lógica subyacente a las teorías matemáticas. Su “predicativismo” se limitó a criticar el uso de cierto tipo de definiciones, sin imponer ninguna condición a los modos de razonamiento admitidos, es decir, aceptando de manera implícita la lógica de predicados de Frege. No obstante, estas críticas sentaron la base para el ulterior desarrollo del tema. Al respecto, Russell fue el primero en formular los principios del predicativismo en Principia Mathematica y Brouwer el primero en someter a una revisión exhaustiva los principios de la lógica sobre la base de lo que se puede lograr mediante construcciones mentales. 3.6.3. El principio del círculo vicioso y las definiciones no predicativas Como ya lo hemos señalado, muchas paradojas como las de Russell, Cantor y BuraliForti tienen una característica en común: encierran una definición impredicativa (o no predicativa) que da lugar a lo que se ha dado en llamar un círculo vicioso. Por ejemplo, 62 Poincaré 1908, p. 150 de la traducción al español. definición contiene dos elementos: el definiendum o concepto (término) por definir, y el definiens o conjunto de conceptos (términos) que determinan al definiendum. Al respecto, dice Poincaré: “Una definición que contiene un círculo vicioso no define nada.” Esto lo justifica de la siguiente manera: Para que una definición sea legítima, debe ser posible substituir el definiendum por el definiens. En el caso de una definición que contiene un círculo vicioso la substitución nunca terminará (pues el definiendum reaparece en el definiens). 63 En principio, toda 168 3. L A CUESTIÓN DE LOS FUNDAMENTOS ... la paradoja de Russell tiene como base la siguiente definición de una clase R: ∀x(x ∈ R ↔ x ∈ / x) Nótese que en la fórmula anterior, la variable cuantificada x tiene como dominio de variación a la clase de todas las clases, una totalidad a la que R, en caso de existir, pertenece. En otras palabras, R se define con base en una totalidad de la que ella misma formaría parte. Entre quienes rechazaron tal tipo de definiciones podemos mencionar, además de Poincaré, a Bertrand Russell y Hermann Weyl. Para evitar esta clase de problemas idearon el principio del círculo vicioso (PCV). Gödel expresa este principio en su forma más general con las siguientes palabras: Ninguna totalidad puede contener miembros definibles sólo en términos de esa totalidad. En las paradojas ya mencionadas se infringe este principio.64 Con relación a las propiedades, el principio del círculo vicioso se puede formular como sigue: Ninguna propiedad P se puede predicar de un objeto cuya definición depende de P. Una variante técnica de lo anterior, debida a Russell, es la siguiente: Cualquier cosa cuya definición comprenda una variable aparente no puede hallarse entre los posibles valores de esa variable.65 Cuando una definición infringe el principio anterior se dice que es no predicativa. El problema con el rechazo de tales definiciones es que requiere de una profunda revisión de las matemáticas clásicas, donde no son infrecuentes. Por ejemplo, la definición del supremo s de un conjunto X de números reales es no predicativa: Sup(s, X) ≡de f (∀x(x ∈ X → x ≤ s)) ∧ ∀z(∀x(x ∈ X → x ≤ z) → s ≤ z))) En la definición anterior es evidente que el número s se halla dentro del dominio de variación de la variable z. Aquí el punto es que el llamado axioma del supremo es una herramienta fundamental en la teoría axiomática de los números reales, algo a lo que muchos matemáticos no estaban dispuestos a renunciar. Por otra parte, parece no haber un camino que lleve a la introducción de los números reales sin pasar por la no predicatividad. Hacerlo mediante las cortaduras de Dedekind no resuelve nada, pues la definición de estas entidades también es no predicativa.66 En términos generales la oposición al principio del círculo vicioso se debe a que las definiciones no predicativas son algo común y generalmente inocuo en la matemática, 64 En Principia Mathematica Russell y Whitehead insisten en que todo círculo vicioso tiene como base la suposición de que una colección de objetos puede contener miembros sólo definibles por medio de la colección como un todo. Y esto es precisamente lo que intentan prohibir: “Cualquier cosa que comprenda todo lo de una colección no debe ser uno de la colección.” (Russell y Whitehead, 1910, p. 37). 65 Russell, 1906. 66 Vease (Feferman, 1964, parte I) y (Kleene, 1952, §12). 3.6. P OINCARÉ , W EYL Y EL PREDICATIVISMO 169 presentándose incluso en circunstancias muy simples. Por ejemplo, si X es un conjunto de números enteros, el mínimo de X se define como aquel elemento de X que es menor o igual que cualquier elemento de X, una definición impredicativa. Es más, las definiciones de este tipo se presentan no sólo en el análisis matemático, sino en muchas áreas consideradas como “no problemáticas”, como la teoría de la recursión. Un ejemplo es la definición de función recursiva que ofrecen Tarski y Mostowski en Undecidable Theories.67 Además, su presencia en la matemática es anterior a la llamada crisis de los fundamentos. Por ejemplo, en 1821 Cauchy utilizó una definición impredicativa en la prueba del teorema fundamental del álgebra.68 Tal como lo advierte Zermelo (v. Zermelo, 1908, p. 191), a nadie se le ha ocurrido considerar el procedimiento seguido por Cauchy como algo irrazonable.69 En el mismo tono Ramsey nos recuerda que muchas definiciones no predicativas son totalmente inofensivas, como cuando nos referimos a una persona como “el individuo más alto del salón”, en cuyo caso el objeto definido depende de un conjunto de individuos del que es un elemento. Frente al principio de círculo vicioso no podemos dejar de mencionar la postura de Kurt Gödel, un fuerte defensor del realismo conceptual. Grosso modo, los seguidores de esta corriente mantienen que los objetos abstractos, las ideas, tienen una realidad que les es propia, que éstos existen independientemente de que los pensemos o los podamos “percibir”. En particular, Gödel sostiene que la teoría cantoriana trata con entidades de ese tipo, siendo la tarea del matemático describir dicha realidad (a esto habremos de volver más adelante). Desde esta perspectiva las definiciones impredicativas no encierran ningún peligro, pues la existencia de aquello que se define no depende del modo en que se haga esto último. Es más, en ocasiones la única manera de determinar un objeto matemático es mediante una definición de este tipo. Ergo, no tiene sentido prohibir tal modo de proceder. En todo caso, lo que a Gödel le parece falso es el principio del círculo vicioso. Esto lo afirma al observar que Russell y Whitehead se vieron forzados a abandonar en Principia Mathematica la forma fuerte de este principio. 67 La definición es esta: Una función aritmética es recursiva si y sólo sí pertenece a cada conjunto X de funciones que satisface las siguientes condiciones: (i) La función sucesor s pertenece a X; (ii) la función e(x) pertenece a X (donde e(x) es la diferencia entre x y el mayor número cuadrado menor o igual que x); (iii) Si f y g pertenecen a X, entonces f + g y f · g pertenecen a X; y (iv) Si f está en X y f toma como valores a todos los números naturales, entonces f −1 también pertenece a X (donde f −1 (y) se define como el menor x tal que f (x) = y). Obviamente, la clase F formada por las funciones recursivas es la intersección de todos los conjuntos X que cumplen las condiciones (i)-(iv), por lo que también es uno de ellos. Por tanto, la definición de F es no predicativa. 68 Cauchy, Cours D’Analyse, 1821. En su argumento, Cauchy recurre al mínimo de un conjunto previamente definido, para lo cual, como recién lo acabamos de indicar, debió apoyarse en una definición no predicativa. 69 Zermelo, 1908, p. 191. Esto no supone un desinterés por parte de Zermelo frente al problema de la circularidad. Simplemente, considera que prevenir los problemas derivados del mal uso de ésta no es lo mismo que prohibir las definiciones impredicativas. En su opinión esta tarea recae en los axiomas de la teoría de conjuntos, los cuales han de regular la manera en que se pueden obtener nuevos conjuntos. De hecho él fue el primero en avanzar en esta dirección justo en el ensayo de 1908. Es más, los distintos sistemas axiomáticos para la teoría de conjuntos que conocemos se pueden clasificar acorde a la manera en que bloquean las paradojas (al respecto véase Rosser, 1953, pp. 197-207). 170 3. L A CUESTIÓN DE LOS FUNDAMENTOS ... Sus palabras exactas son: “Yo consideraría esto [el que en los Principia no se recurra al PCV] más bien como una prueba de que este principio es falso, antes que una prueba de que la matemática clásica es falsa.” (Gödel, 1944, p. 455). Gödel insiste en que las definiciones impredicativas son legítimas siempre que, como él, se adopte un punto de vista realista con relación a las entidades matemáticas. En otras palabras: el rechazo del principio del círculo vicioso está asociado a la repulsa por parte de Gödel de la tesis de que los objetos matemáticos son una invención humana. Sostiene que la forma fuerte de dicho principio sólo aplica cuando las entidades involucradas son construcciones nuestras, pues la construcción de algo no puede basarse en una totalidad a la que este algo ya pertenece. “No obstante, nos dice, si se trata de objetos que existen con independencia de nuestras construcciones, no hay nada absurdo en la existencia de totalidades que contienen miembros que sólo pueden ser descritos (i. e., caracterizados en forma única) haciendo referencia a dicha totalidad.” (Gödel, 1944, p. 219 de Benacerraf, 1964.) Desde este punto de vista las cortaduras de Dedekind (al igual que cualquier otro concepto matemático definido impredicativamente) no son definiciones o construcciones, sino descripciones, es decir, imágenes de entidadades que “ya están allí”. Kleene lo explica de la siguiente manera: “Uno puede tratar de defender esta definición impredicativa [la de una cortadura] interpretándola, no como definiendo o creando el número real u por primera vez [...], sino sólo como una descripción que separa al particular número u de la totalidad ya existente de números reales.” (Kleene, 1952, p. 43). El método axiomático es compatible con esta forma de ver las definiciones impredicativas, es decir, permite pensarlas como caracterizaciones o descripciones. Al respecto, la suposición axiomática de la existencia de la totalidad de los números reales ha probado, hasta ahora, ser consistente. Esta es una de las razones por las que los matemáticos la siguen utilizando junto con los métodos impredicativos, los cuales se presentan como algo claro, preciso y de trato fácil, reforzando la idea de que culparlos de la aparición de las antinomias es un error. 3.6.4. Weyl y Feferman Entre los defensores del principio del círculo vicioso no sólo tenemos a Poincaré y Russell, sino también a figuras como Brouwer y Hermann Weyl. Lo hecho por este último tiene importancia para nosotros en virtud de que su intervención en el debate influyó en la decisión de Hilbert de buscar una solución definitiva al problema de los fundamentos de la matemática. Hubo en ello un factor personal. Desde siempre Hilbert tuvo un afecto y un respeto muy especial hacia Weyl.70 Así, la postura constructivista adoptada por este último en su libro Das Kontinuum, publicado en 1918, no sólo lo tomó por sorpresa, pareciéndole inverosímil que tales ideas hubieran hecho mella en él, sino que también lo afectó en el plano emotivo. 70 Weyl obtuvo en 1908 el grado de doctor bajo la supervisión de Hilbert con un trabajo sobre ecuaciones integrales. A partir de ese momento la mutua admiración no tuvo límites, al punto que en 1930 Weyl fue designado sucesor de Hilbert en Götingen por sugerencia de este último. 3.6. P OINCARÉ , W EYL Y EL PREDICATIVISMO 171 En Das Continuum Weyl intenta desarrollar el análisis matemático con apego al principio del círculo vicioso, asumiendo en ello una posición similar a la de Russell y Poincaré.71 Y eso no fue todo: poco tiempo después, en 1921, publicó un polémico artículo en el que criticaba al formalismo, adoptando una actitud muy cercana a la de Brouwer.72 Esto era más de lo que Hilbert podía tolerar: Weyl se había desplazado al bando rival ¿Qué había sucedido? ¿Por qué se dejaba llevar por esas extrañas ideas que enrarecían la atmósfera? Hasta entonces, Hilbert había hecho caso omiso de las críticas de Brouwer (quien solía referirse a la aceptación indiscriminada del principio lógico del tercero excluido como “el dogma de Hilbert”), pero ahora las cosas habían ido demasiado lejos, haciéndole sentir la necesidad de finiquitar definitivamente la cuestión de los fundamentos de la matemática. Fue entonces que emprendió la elaboración de un detallado programa cuyo objetivo era probar la consistencia de la matemática clásica, un esfuerzo que le llevaría cerca de diez años y que habremos de abordar más adelante. Veamos algunos de los logros de Weyl. En Das Continuum este autor desarrolla el análisis predicativo (i. e., el análisis matemático sin el recurso a definiciones impredicativas) basándose en los niveles más bajos de la teoría ramificada de tipos de Russell (que habremos de bosquejar en la siguiente sección). En su intento logra desarrollar gran parte del cálculo diferencial e integral clásico sin usar el axioma de elección, el axioma del supremo, pruebas por contradicción o conjuntos infinitos. Su idea era sujetarse a los lineamientos del constructivismo radical, al parecer bajo la influencia del filósofo idealista alemán Fitchte, un continuador de la filosofía crítica de Kant. Las palabras iniciales de Das Kontinuum dan una clara idea de sus intenciones: No es el propósito de este trabajo cubrir la “firme roca” sobre la que se funda el edificio del análisis, con su falsa estructura formalista de madera –una estructura que puede engañar al lector y, en última instancia, al autor, al hacerlo creer que se trata de un verdadero fundamento. Más bien, mostraré que este edificio está construido en gran medida sobre arena. Creo poder cambiar este vacilante fundamento con pilares de fortaleza duradera. No obstante, estos pilares no sostendrán todo lo que hoy en día se considera firmemente fundado. He de renunciar al resto, pues no veo ninguna otra posibilidad. En un pasaje en el que se deslinda de Dedekind, Frege, Russell y Cantor, Weyl señala que la idea de iteración (es decir, la idea de la sucesión de los números naturales), tal como la expone Poincaré, es el fundamento último del pensamiento matemático. Es a partir de ella que se ha de levantar el edificio del análisis mediante procedimientos de definición que delimiten, de manera precisa, la esfera de propiedades y 71 Weyl, 72 Weyl, 1918. 1921. 172 3. L A CUESTIÓN DE LOS FUNDAMENTOS ... relaciones a las que corresponden los conjuntos y las funciones. Para ello no requiere de la definición de número natural de Russell (como clases de equivalencia bajo la relación de equinumerosidad), ni del dudoso axioma de reductibilidad que Russell y Whitehead introdujeran en Principia Mathematica (v. sección 3.7). A causa de tales procedimientos, dice, “Russell y yo estamos separados por un verdadero abismo.” Al igual que Poincaré, Weyl acepta como elementos básicos los principios de prueba asociados al sistema de los números naturales como, por ejemplo, las pruebas por inducción y las definiciones por recursión. De esta manera, la tarea básica de Weyl consiste en ver qué tanto se puede reconstruir del análisis matemático sobre una base estrictamente predicativista, dados los números naturales. En vista de que el sistema de los números racionales se puede reducir al sistema de los números naturales, y que el continuo de los números reales se puede identificar con sucesiones de números racionales (a la manera de Dedekind), los principios apropiados a considerar son aquellos que rigen a las sucesiones de números naturales. Para tal fin Weyl desarrolla una teoría axiomática de segundo orden (que aquí denotaremos con HW) en la que las variables de tipo 1 varían sobre los números naturales, mientras que las de tipo 2 lo hacen sobre conjuntos, relaciones y funciones entre números naturales definidas predicativamente.73 A diferencia de Russell, Weyl detiene la ramificación de los tipos en este punto, pues desea evitar los problemas derivados del uso del axioma de reductibilidad (el cual no tiene una justificación predicativa). Un hecho notable es que los axiomas de Weyl no satisfacen los requisitos modernos de formalización debido a las ambigüedades que presentan.74 Tomando como elementos básicos la constante 0 y la función sucesor, Weyl muestra cómo introducir nuevas funciones de tipo 2 mediante definiciones recursivas explícitas. Estos elementos le permiten construir fórmulas aritméticas, las cuales se elaboran mediante ecuaciones y declaraciones de pertenencia (x ∈ X) sin cuantificar variables del tipo 2 (i. e., variables de segundo orden que corren sobre conjuntos, relaciones y funciones). Es aquí donde aparece el axioma de comprensión para conjuntos de números: ∃X∀y(y ∈ X ↔ φ (x)) donde X es una variable de tipo 2 y φ (x) es una fórmula aritmética que no contiene libre a X. Todo conjunto definido de esta manera se denota con {x|φ (x)} y corresponde a lo que para Frege es la extensión del predicado φ (x). Lo mismo se puede hacer con las relaciones y las funciones. Aquí también vale el axioma de extensionalidad. 73 En el punto de partida de la teoría de la cuantificación se halla la llamada lógica de primer orden, en la que la cuantificación sólo se aplica a variables individuales. Esta teoría puede extenderse a una lógica de segundo orden en la que se añaden variables para las propiedades, relaciones y funciones entre individuos y se cuantifica sobre ellas. Los sistemas de uno y otro tipo tienen propiedades muy distintas entre sí. V. (Enderton, 1972), caps. 2 y 4. 74 En 1988 Solomon Feferman sugirió algunos cambios que permitirían una doble reconstrucción del sistema, según se quisiera conservar el espíritu original del proyecto, o admitir la inclusión de principios relativos a variables del tipo 2 que lo fortalecerían. V. Feferman, 1988. 3.6. P OINCARÉ , W EYL Y EL PREDICATIVISMO 173 Si bien Weyl se adhiere a la lógica de Frege en su sistema, en ningún momento asume la existencia del conjunto N de los números naturales como una totalidad infinita y acabada, tal como lo hace Cantor. Los números racionales los introduce como cuartetas de números naturales (x, y, z, w), donde y = 0 y w = 0 y una adecuada definición de las operaciones básicas entre ellos. Esto no representa ningún problema. Como siempre, dos números racionales se consideran iguales cuando satisfacen la consabida relación de equivalencia. Las verdaderas dificultades se presentan al considerar los números reales, parte esencial del continuo numérico. En el sistema de Weyl los números reales se introducen como las partes izquierdas de las cortaduras de Dedekind. Obviamente, la definición de las cortaduras depende de los predicados posibles en HW. Dado que N es biyectable con Q, los números reales corresponden a ciertos subconjuntos de N. Por lo tanto, un conjunto X de números reales está dado por una propiedad φ (Y ) aplicable a subconjuntos Y de N. En el caso de Dedekind, el supremo de un conjunto X (cuando éste está acotado superiormente) es simplemente la unión de las cortaduras izquierdas que son miembros de X. En HW dicha unión corresponde a la unión de los conjuntos Y que satisfacen φ , i. e., debería ser un conjunto Z que satisficiera la condición ∀x(x ∈ Z ↔ ∃Y (φ (Y ) & x ∈ Y )) No obstante, en este sistema la existencia de tal conjunto Z no está garantizada por el axioma de comprensión, con el agravante de que la expresión utilizada para definir a Z no es admisible, pues es impredicativa: en ella se apela a todos los subconjuntos de N, uno de los cuales sería Z. Esto parecería un obstáculo insuperable para el sistema de Weyl, pues el axioma del supremo constituye una de las piezas fundamentales del análisis clásico. A pesar de ello, Weyl logra derivar el principio del supremo para sucesiones de números reales, lo cual muestra ser suficiente para la mayoría de las aplicaciones. En efecto, en HW una sucesión de números reales corresponde a una sucesión X0 , X1 , . . . , Xn , . . . de subconjuntos de N, la cual está dada por una única relación binaria S tal que X ∈ Xn ↔ S(x, n) En tal caso la unión de la sucesión queda definida por la fórmula ∀x(x ∈ X ↔ ∃nS(x, n)) de modo que el conjunto X tiene existencia en virtud del axioma de comprensión. Con base en el principio del supremo restringido de esta manera, Weyl logra demostrar que la teoría de funciones continuas (las cuales están determinadas por completo por sus valores en Q) se puede desarrollar en su sistema. Algo que Weyl no logró desarrollar fue la teoría de la integración de Lebesgue, una extensión de la de Riemann.75 75 A principios del siglo veinte, Lebesgue extendió el concepto de integral de Riemann a una clase 174 3. L A CUESTIÓN DE LOS FUNDAMENTOS ... En épocas más recientes Feferman logró algunos avances en el desarrollo del análisis con las restricciones impuestas. En un texto publicado en 1964 muestra que muchos resultados obtenidos mediante métodos impredicativos se pueden alcanzar con métodos predicativos (v. Feferman, 1964). No obstante, en el mismo lugar prueba que la proposición aritmética que expresa la consistencia del análisis predicativo es demostrable con métodos impredicativos. A causa de ello sabemos, en virtud del segundo teorema de Gödel (que más adelante veremos), que no todo el análisis impredicativo se puede reducir al predicativo. Por tanto, la restricción a métodos predicativos sí elimina una porción de las matemáticas clásicas.76 Las diferencias entre Weyl y los formalistas se agudizaron a partir de 1921 tras la publicación de un artículo en el que este autor radicalizó aún más su postura, defendiendo el enfoque intuicionista de Brouwer.77 Bajo el brillante estilo literario que le es propio, Weyl ofrece razones sumamente convincentes para adherirse a esta corriente, llegando incluso a afirmar que ello significaba una revolución.78 Esta publicación tuvo una enorme influencia en la propagación de las ideas de Brouwer, mayor incluso que la lograda por este último con sus trabajos. Según cuenta Constance Reid en su libro Hilbert, a los amigos de Weyl les parecía que “[Weyl] podía experimentar un placer tóxico al dejarse llevar, o simplemente sacudir, por las corrientes opuestas que perturbaron el período.”79 Esta fascinación de Weyl por las ideas de Brouwer disgustó a Hilbert, trayendo a su memoria el recuerdo de Kronecker: ¿Cómo su alumno predilecto podía estar dispuesto a echar por la borda gran parte de los logros de la matemática moderna por sus ideas filosóficas? ¿Sería acaso correcto eso que dijera Weyl, en el mucho más extensa de funciones, las cuales pueden tener un comportamiento muy complejo o dominios que en nada nos recuerdan a las funciones continuas del cálculo tradicional. Para el caso consúltese Rudin, 1987. 76 Los teoremas de Gödel y sus implicaciones los habremos de examinar en el capítulo 5. Quien no esté familiarizado con estos temas puede pasar por alto este comentario o simplemente entender que se trata de una manera de señalar un límite al alcance del análisis predicativo. La inclusión del comentario tiene como propósito señalar qué se ha logrado en este dominio. 77 Weyl, 1921. Ya en 1918, en una famosa reunión de matemáticos en Zurich, Weyl y Polya habían hecho una apuesta sobre la dirección en que habría de desarrollarse la matemática en los siguientes años. Los términos de la apuesta los narra Constance Reid en (Reid, 1970). El debate era en torno a la futura situación de las siguientes proposiciones: (1) Cada conjunto acotado superiormente de números reales tiene una cota superior exacta; (2) Cada conjunto infinito de números reales tiene un subconjunto numerable. Weyl sostenía que en veinte años los matemáticos ya habrían reconocido la imprecisión de tales afirmaciones, atribuyéndoles un sentido tan vago como el que se le otorga a las afirmaciones de Hegel sobre la filosofía de la naturaleza (es decir, no pudiéndoseles atribuir ningún valor de verdad). Obviamente, la proposición (1) va en contra del axioma del supremo, mientras que la (2) constituye un rechazo al axioma de elección. Se dice que una vez vencido el plazo, una consulta entre algunos destacados matemáticos del momento dio como ganador a Polya. 78 Las palabras exactas de Weyl son estas: “Traté de hallar piso firme en la inminente disolución del análisis [. . . ] sin renunciar al orden en que se le ha fundamentado, desarrollando su principio básico con pureza y honestidad. Creo haber tenido éxito –en la medida en que esto es posible. Pues dicho orden es en sí insostenible, como Brouwer y yo nos hemos convencido– ¡ésta es la revolución!”. (Weyl, 1921, pp. 98-99) 79 Reid, 1970, p. 149. 3.7. E L LOGICISMO DE RUSSELL Y W HITEHEAD 175 sentido de que había que renunciar a todo lo que no pudiera reclamar un verdadero valor de verdad con base en la evidencia? Para Hilbert, secundar a Brouwer era tanto como revivir las querellas de Kronecker, y escuchar esto en boca de Weyl era traer la polémica al interior de la familia, lo cual rebasaba los límites de su tolerancia.80 En cuanto al programa predicativo, Weyl nunca lo prosiguió, si bien siguió mencionándolo en sus trabajos hasta el final de su vida.81 Lo que sí fue un hecho es que a partir de 1925 Weyl comenzó a distanciarse del intuicionismo de Brouwer, aparentemente llevado por la idea de que limitaba en demasía a la matemática.82 Fue entonces que reconcilió parcialmente su postura con la de Hilbert y acercó su pensamiento al de Edmund Husserl y de Ernst Cassirer. 3.7. El logicismo de Russell y Whitehead Uno de los principales exponentes del logicismo en el siglo veinte fue Bertrand Russell quien, al igual que Frege, pretendía reducir todo el contenido de la matemática al de la lógica, para así concluir que la primera no era sino una de sus ramas.83 Esta idea encuentra su expresión más acabada en tres de sus obras: The Principles of Mathematics, de 1903; Principia Mathematica, de 1910 (en colaboración con Alfred North Whitehead) e Introduction to Mathematical Philosophy, de 1919.84 En ellas, un tema central es la reconstrucción de la aritmética como parte de la lógica. Dice Russell: El presente trabajo tiene dos propósitos esenciales. Uno de ellos, la prueba de que toda la matemática puede trabajar exclusivamente con conceptos definibles en función de un número muy pequeño de conceptos lógicos fundamentales y de que todas las proposiciones se pueden deducir de un número muy pequeño de principios lógicos fundamentales [...]. Si no me equivoco, la demostración de esta tesis tiene toda la certeza y precisión de que son posibles las demostraciones matemáticas.85 En los Principia la lógica está dividida en dos grandes apartados: la lógica proposicional 80 La reacción de Hilbert no fue lo más grave que pudo pasar entre él y Brouwer. Más bien, ésta constituyó un signo de algo que más tarde daría lugar a un vergonzoso pasaje en la historia de las matemáticas. Dicho pasaje, al cual no referimos someramente en el apéndice I, nos debe servir como recordatorio de que quienes cultivan la matemática no son fríos y apacibles pensadores, dispuestos a actuar con sensatez, prudencia y ecuanimidad en pos de la sabiduría, sino seres humanos que, como cualquier otro, pueden ser arrastrados por sus pasiones a límites insospechados. 81 Véase, por ejemplo, Weyl, 1949, Cap. 2 §8. 82 Al respecto véase Mancosu, 1998, pp. 76-81. 83 En cierto sentido, esta reducción ya estaba sugerida por la construcción genética de los números reales con base en los números naturales y la noción de conjunto. Lo único que hacía falta era identificar la noción de conjunto con la noción lógica de clase (o, como veremos, absorber esta última en la lógica de predicados) y definir la noción de número natural como una noción lógica. 84 V. Russell, 1903, Russell y Whitehead, 1910 y Russell, 1919. 85 Russell, 1903. Cita tomada de la traducción al español, p. 19. 176 3. L A CUESTIÓN DE LOS FUNDAMENTOS ... (estudio de las operaciones lógicas de negación, conjunción, disyunción, e implicación material) y la lógica de predicados (lógica de las funciones proposicionales, o estudio de los enunciados incompletos que contienen variables); en esta última se consideran enunciados universales y enunciados existenciales mediante los operadores “para todo x” (universal) y “existe un x tal que” (existencial).86 Como de la lógica de predicados se deriva la teoría de los símbolos incompletos (descripciones y clases), el cálculo de clases deja de ser una disciplina fundamental de la lógica: La siguiente teoría de clases, aunque proporciona una notación para representarlas, evita el supuesto de que existen cosas tales como clases. Esto se logra definiendo proposiciones en cuya expresión figuran símbolos que las representan [...] Una clase se caracteriza por consistir de todos los términos que satisfacen una función proposicional, de tal modo que toda función proposicional determina una clase y dos funciones formalmente equivalentes (i. e., tales que la verdad de una implica la verdad de la otra) determinan una misma clase. Recíprocamente, si dos funciones determinan la misma clase, son formalmente equivalentes. Cuando dos funciones son formalmente equivalentes decimos que tienen la misma extensión.87 Es así que en los Principia la teoría de clases se deriva completamente de la teoría de las funciones proposicionales, de la cual constituye sólo una parte. La clase determinada por una función proposicional F(x̂) se denota con x̂F(x) y la relación de pertenencia a una clase, denotada con el símbolo “∈”, tiene una definición que conduce directamente a la equivalencia x ∈ ẑF(z) ↔ F(x̂) La unión e intersección de dos clases se definen en términos de la disyunción y conjunción de las funciones proposicionales que las generan. Una vez “inmersa” la 86 El cálculo de predicados también es conocido como “cálculo funcional”, pues en él se estudian expresiones en las que figuran variables no ligadas por ningún operador, llamándose a tales expresiones funciones proposicionales. El rasgo distintivo de las funciones proposicionales que éstas se caracterizan porque dan lugar a proposiciones cuando sus variables se substituyen por términos con significado constante (es decir, porque se convierte en una entidad lógica de la que podemos afirmar que es verdadera o falsa). Por ejemplo, la expresión “x > y” es una función proposicional que da lugar a una proposición cuando las variables “x” e “y” se substituyen, digamos, por los términos “5” y “3”. Junto a la distinción entre proposición y función proposicional, podemos establecer la distinción entre descripciones completas y descripciones incompletas. Una descripción incompleta es una expresión que contiene variables y que da lugar a una descripción (completa) cuando éstas se sustituyen por términos de significado constante. Por ejemplo, la expresión “El presidente de x” es una descripción incompleta, que da lugar a una descripción completa cuando, digamos, “x” se substituye por la palabra “México”. La utilidad de las descripciones como artificios del lenguaje es que permiten hacer referencia a objetos para los cuales no se tiene un nombre, pero sí el vocabulario suficiente para describirlos o caracterizarlos. Un caso concreto es el siguiente: “el mínimo entero x, tal que x es primo y mayor que 10100 ”. Como veremos, Gödel se apoya en este recurso al construir un enunciado autorreferente. 87 Russell y Whitehead, 1910, *20. 3.7. E L LOGICISMO DE RUSSELL Y W HITEHEAD 177 teoría de clases en la lógica formal, Russell y Whitehead definen, inspirados en Frege, los conceptos fundamentales de la aritmética mediante recursos puramente lógicos siguiendo un camino que aquí no explicaremos. El caso es que, por ejemplo, un número como el “uno” se define como “la clase de todas las clases unitarias”.88 En su simbología: 1 = x̂{(∃x).α = i x}Df89 Para resolver el problema de las antinomias, Russell y Whitehead recurrieron al ya mencionado principio del círculo vicioso: un objeto cuya definición implica la totalidad de los elementos de un conjunto, no puede pertenecer a este conjunto. Como ya lo hemos visto, el problema con esta regla es que no sólo evita la formación de conjuntos como el de Russell, sino que también estropea el uso de definiciones impredicativas. Esto planteaba un dilema: por una parte, Russell y Whitehead estaban convencidos de que la única manera de cerrar el paso a las antinomias era impidiendo esta clase de círculos viciosos;90 por la otra, en la matemática se recurre a este tipo de definiciones impredicativas para introducir algunas nociones que no se pueden caracterizar de otro modo. Para salir del problema, decidieron establecer una jerarquía que obligaba a una clase y sus elementos (es decir, a un predicado y sus argumentos) a mantenerse a un grado de separación, con lo que quedaba prohibida la existencia de clases que se contuvieran a sí mismas como elementos o la formación de enunciados autoreferentes (pues no se permitía que una propiedad se predicara de sí misma). Tal jerarquización dio lugar a la llamada teoría ramificada de tipos, y no fue todo lo satisfactoria que sus autores pensaron. La teoría de tipos establece una distribución en niveles de los elementos con que se trabaja. Los elementos primarios (objetos individuales) constituyen las entidades de tipo 0 (primer nivel). Las clases de elementos de tipo 0 constituyen los elementos de tipo 1, las clases de elementos de tipo 1 (es decir, clases de clases de elementos de tipo 0) constituyen los elementos de tipo 2 y así sucesivamente. Por ejemplo, si consideramos a los seres humanos como entidades de tipo 0, la bondad o el ser bondadoso (esto es, el predicado expresado por “x es bondadoso”) corresponde al tipo 1, mientras que las propiedades de ser una virtud o ser un defecto corresponden al tipo 2, ya que sólo tiene sentido afirmarlas de propiedades como la bondad. En esta teoría todo atributo debe ser de un tipo superior al de las entidades sobre las cuales puede 88 Op. cit., *52. a un lado la notación y la teoría de tipos, podemos aproximar esta definición en una escritura moderna como sigue: 1 = {X|(X = ∅) ∧ ∀y∀z((y ∈ X ∧ z ∈ X) → y = z)}. Algo que llama nuestra atención es que para definir el primero de los números naturales, es decir, para dar inicio a la reconstrucción de la aritmética propiamente dicha, los autores demoran unas 350 páginas, lo que no deja de ser un argumento en contra del proyecto de Russell y Whitehead, el cual despierta la duda en el matemático activo sobre si será necesaria toda esta maquinaria para finalmente arribar a una noción tan simple. Sin duda, ésta es una de las razones por las que Principia Mathematica no alcanzó una gran difusión, ni despertó el interés de muchos matemáticos. 90 Russell en particular estaba convencido de que las antinomias en la teoría de conjuntos tenían su origen en la lógica, no en la matemática, y que estas desaparecerían al descartar el círculo vicioso. 89 Haciendo 178 3. L A CUESTIÓN DE LOS FUNDAMENTOS ... aseverarse con sentido. Así, de acuerdo a esta teoría, enunciados como “heterológico es heterológico” ó “B ∈ B” carecen de sentido. No obstante, a fin de obtener ciertas definiciones impredicativas que son necesarias para reconstruir el análisis (como las señaladas en la sección 3.6.3), Russell y Whitehead se vieron obligados a recurrir a un discutible axioma de reductibilidad que permitía introducir propiedades de primer orden (o primer tipo) con la misma extensión lógica que propiedades de orden superior.91 Este axioma era difícilmente justificable en los términos propuestos (“sólo principios lógicos”) y su introducción constituía una imperfección. Los mismos autores así lo reconocen en la introducción a la segunda edición de los Principia: “La justificación de este principio es puramente pragmática: lleva a los resultados deseados y a ningún otro. Pero es claro que no es la clase de axioma del cual podamos estar satisfechos.”92 Otro aspecto polémico de los Principia es que la deducción de la matemática a partir de la lógica tiene como base una axiomática intuitiva, de la que se espera que sus axiomas sean creídos o al menos aceptados como hipótesis plausibles acerca del mundo. Esta manera de tratar a la lógica iba en la dirección contraria a la de Hilbert, quien veía en ello un regreso a usanzas ya superadas.93 Una dificultad que asoma de inmediato es la siguiente: ¿sobre qué base se debería creer en el axioma de reductibilidad? Si las propiedades se construyen (como lo establece la teoría de tipos), entonces la cuestión de la existencia de una propiedad de primer orden equivalente a una propiedad dada se debería decidir en términos de construcciones, no mediante un axioma. Es más, no sólo el axioma de reductibilidad fue objeto de críticas. Al referirse al axioma del infinito (afirmación de la existencia de una infinidad de individuos), Cavaillès observa que este axioma también rebasa el ámbito de la lógica, pues se trata de una proposición sintética que el mismo Russell reconoce como una hipótesis, no como el enunciado de una propiedad objetiva.94 En un pasaje de su libro Introduction to Mathematical Philosophy, Russell afirma que “No se puede decir que es algo seguro que hay de hecho algunas colecciones infinitas en el mundo. La hipótesis de que las hay es lo que llamamos ‘axioma del infinito’”95 , y más adelante agrega: “Podemos considerar el axioma del infinito como un ejemplo de proposición que, aunque se puede enunciar en términos lógicos, la lógica no la puede afirmar como verdadera. 91 Por ejemplo, los números reales, en tanto que conjuntos de números racionales, serían de un tipo superior al de los números racionales y éstos a su vez lo serían con relación a los números enteros y naturales. No obstante, en el análisis matemático estos objetos se consideran como de un mismo nivel, de ahí la necesidad del axioma, que garantizaría la existencia de una propiedad equivalente a aquella que define a los números reales, pero de primer orden, con lo que todos estos números se hallarían entre los objetos básicos. 92 Op. cit., Introducción, p. XIV. 93 Al respecto, véase la sección 3.4 con relación al punto de vista de Hilbert en ese momento. 94 Cf. Cavaillès, 1938, página 62 de la traducción al español. El axioma del infinito afirma la existencia de un conjunto inductivo, es decir, de un conjunto no vacío X con la siguiente propiedad: si x ∈ X, entonces {x} ∈ X. Por su misma naturaleza, todo conjunto inductivo es infinito. 95 Russell, 1919, p. 131. 3.7. E L LOGICISMO DE RUSSELL Y W HITEHEAD 179 Todas las proposiciones de la lógica tienen la característica que solíamos expresar diciendo que eran analíticas o que sus contradictorias eran autocontradictorias.”96 Junto a este pragmatismo que les permite alcanzar la teoría de los números reales o introducir colecciones infinitas, Russell y Whitehead hacen gala de un realismo semejante al de Frege, en el que, como dice Cavaillès, “las construcciones lógicosimbólicas (como aquellas en las que intervienen conjuntos y números) no son sino los medios para describir las relaciones entre objetos (relaciones) que existen por sí mismos, independientemente de aquéllos.”97 Al respecto Hermann Weyl hace el comentario de que en el sistema de Principia Mathematica, la matemática no se funda sobre la lógica, sino en una especie de paraíso para el lógico y señala que quien esté dispuesto a creer en este mundo trascendente podría igualmente aceptar el sistema axiomático de la teoría de conjuntos (por ejemplo, ZFC) que, para la deducción de la matemática, tiene la ventaja de ser más simple en su estructura.98 Si bien Principia Mathematica fue una fuente inagotable de conceptos y recursos simbólicos, es innegable que su publicación marcó el inicio del declive del proyecto de fundamentación russelliano. Es un hecho que en la tercera década del siglo veinte el mando en las investigaciones en torno a los fundamentos de la matemática pasó a manos de Hilbert, de cuya actividad en esta área se habían de derivar directamente los desarrollos subsiguientes. Una de las razones del debilitamiento del logicismo fue que la solución que ofrecía al problema de los fundamentos no era plenamente satisfactoria. Por ejemplo, en su contra se argumentaba que si bien las paradojas conocidas de la teoría de conjuntos quedaban eliminadas mediante la teoría de tipos, no había garantía alguna de que no surgirían nuevas antinomias en el futuro. Obviamente la sola eliminación de las paradojas ya conocidas no constituía un resguardo seguro para la matemática. Como ya lo hemos dicho, para Hilbert tal resguardo sería una prueba de consistencia absoluta, para lo cual no era necesario suponer la existencia de tales “paraísos lógicos”; en esto, los seguidores del formalismo eran refractarios a esta clase de suposiciones, razón por la cual su postura tuvo una mayor aceptación entre los matemáticos. Para concluir diremos que en la obra de Russell y Whitehead debemos distinguir dos aspectos: uno es la forma específica en que pretenden fundamentar la matemática; el otro es la idea (reduccionista) de que la matemática es parte de la lógica. Si bien el sistema de Russell y Whitehead no estuvo a la altura de las expectativas y en la práctica fue ignorado por los matemáticos, de la tesis logicista no podemos decir lo mismo: años más tarde un grupo de filósofos y científicos reunidos en torno a la figura de Moritz Schlik, profesor de la Universidad de Viena, le dio vida nuevamente, esta vez desde una postura antimetafísica y empirista. Al grupo se le conoció como Círculo de Viena y en él participaron, entre otros, Rudolf Carnap, Philipp Frank, Hans Hahn 96 Russell, op. cit. pp. 202-203. 1938, p. 62. 98 Cf. Weyl, 1949, pp. 267-268 de la traducción al español. 97 Cavaillès, 180 3. L A CUESTIÓN DE LOS FUNDAMENTOS ... (asesor de Gödel en su trabajo doctoral), Otto Neurath, Friedrich Waismann y, desde Berlín, Hans Reichenbach.99 3.8. El intuicionismo de Brouwer El intuicionismo matemático fue la respuesta de Brouwer al logicismo, a la matemática no constructiva y a las paradojas, y se apoya en tres tesis radicales: i) los objetos matemáticos se construyen directamente en la intuición pura, siendo por ello previos al lenguaje y a la lógica; ii) las leyes que rigen el comportamiento de dichos objetos se derivan de su construcción, no de la lógica, como pretenden Russell y los logicistas100 y iii) en la matemática no es admisible ninguna teoría que rebase el marco de lo dable en la intuición, como sostienen Hilbert y los cantorianos. En el umbral de la matemática intuicionista se encuentran los números naturales, entendidos éstos como un producto de la mente humana. Estos números no se deducen lógicamente (logicismo) ni se postulan (formalismo), sino que se construyen de inmediato en la mente del matemático y la verdad de los enunciados acerca de ellos se basa en la evidencia intuitiva.101 Sirven como base para construir el resto del edificio. Afirmar la existencia de un objeto con cierta propiedad es lo mismo que afirmar la posibilidad de construir un objeto con dicha propiedad. Dado que todos los objetos matemáticos son construcciones mentales, la existencia de un objeto es equivalente a la posibilidad de su construcción.102 En cuanto a la noción de construcción mental, ésta no puede explicarse a través de conceptos más simples; es, en este sentido, primigenia.103 Dice Dummett: El nombre de “intuicionismo” se debe a la aceptación por parte de Brouwer de la tesis kantiana de que nuestro concepto de la sucesión de los números 99 Consúltese, por ejemplo, Reichenbach, 1951 para una clara exposición de esta postura. síntesis: no es la lógica sino la intuición lo que determina la corrección matemática. 101 Esta evidencia intuitiva no hace referencia a hechos externos de ninguna especie. En este sentido el intuicionismo considera que la matemática es una libre creación del espíritu humano, y que su única limitante es la posibilidad de la construcción. De hecho, esta corriente tiene fuertes vínculos con el constructivismo matemático, aunque este último no asume necesariamente sus supuestos filosóficos. 102 Como es evidente, esta dirección se nutre del pensamiento de Kronecker y del empirismo francés ya referidos en estas páginas, y que se manifiesta, por ejemplo, en la polémica de Poincaré con Russell y Hilbert. Cf. [Poincaré, 1908]. En cuanto a Kronecker, basta recordar la frase que se le atribuye –Dios hizo los números enteros; el resto es obra del hombre– para situarlo como un precursor del intuicionismo (si bien no sabemos a ciencia cierta si él fue realmente el autor de esta frase, la cual al parecer fue un comentario de sobremesa). Lo que sí es un hecho es que Kronecker sostenía la idea de que la aritmética y el análisis se deben fundar en los números enteros, con la exclusión de los números irracionales e imaginarios, lo cual concuerda con las opiniones de Brouwer. 103 En todo caso, Brouwer considera que la descripción y estudio de esta actividad constructiva del espíritu, que él identifica con la parte exacta del pensamiento humano, no es parte de la matemática, sino que se desarrolla en un plano extramatemático o, si se quiere, filosófico, y la obscuridad o vaguedad de los conceptos que se utilizan para describirla no invalida la claridad de su matemática. 100 En 3.8. E L INTUICIONISMO DE B ROUWER 181 naturales se deriva de la intuición temporal, de nuestra aprehensión del paso del tiempo; es decir, no se deriva de detalles cualesquiera de nuestra experiencia, sino de la forma a priori de dicha experiencia en tanto que incluye el suceder temporal. (Brouwer rechazó la tesis kantiana complementaria de que la geometría se basa en nuestra intuición a priori del espacio; en esto, fue una imagen especular de Frege, que aceptó la tesis kantiana acerca de la intuición espacial, pero negó la relativa a la intuición temporal). Por muy importante que parezca esta idea para Brouwer, no es en modo alguno esencial para aceptar la concepción intuicionista de la aritmética. Lo que es fundamental es considerar los números naturales como construcciones mentales, generados de una manera específica mediante la aplicación reiterada de la operación sucesor de 0.104 De lo anterior se desprende que el intuicionismo de Brouwer comprende dos cuestiones en cierto sentido complementarias. Una es su base filosófica, que encuentra sus raíces en la filosofía de Kant; la otra es la peculiar reconstrucción que hace de la matemática, comenzando por la aritmética.105 Para adentrarnos directamente en la polémica con Hilbert, lo más conveniente es enunciar de manera sucinta algunas ideas de Brouwer sobre la matemática clásica y la manera en que considera se le debe rehacer. Si se tiene presente que para él la matemática es ante todo una actividad constructiva del intelecto humano y que sus métodos y procedimientos se han de supeditar a la posibilidad misma de la construcción, las siguientes conclusiones extraídas de sus escritos se explican por sí mismas: 1. La aritmética no se puede justificar mediante un fundamento axiomático, pues la intuición precede a dicha estructura. La inducción matemática es una intuición fundamental, no sólo un axioma. 2. La matemática debe proveer métodos y criterios constructivos para determinar en un número finito de pasos los objetos con los que trata. Toda prueba debe ser constructiva. En particular, dado que el infinito actual no tiene un fundamento constructivo, tampoco tiene cabida en la matemática. Sólo se admite el infinito en potencia. 104 Dummett, 1977, p. 32. concepción de Brouwer se halla dispersa en múltiples ensayos de diferente contenido, unos de carácter técnico, otros de carácter filosófico, muchos de ellos polémicos. No fue sino hasta la aparición de los trabajos de Arend Heyting (1898-1980), una de las figuras rectoras de esta escuela a partir de los años treinta, que estos temas fueron expuestos de manera sistemática (véase sobre todo [Heyting, 1956], donde se expone de manera ordenada la reconstrucción intuicionista de la matemática). En la actualidad se cuenta con algunos textos que abordan el tema de la filosofía y a la matemática intuicionista de manera mucho más accesible; uno de ellos, quizá el más sencillo y recomendable, es el libro recién citado, Elements of Intuitionism de Michael Dummett (v. Dummett, 1977). 105 La 182 3. L A CUESTIÓN DE LOS FUNDAMENTOS ... 3. Toda definición debe permitir la construcción del objeto definido con cualquier grado de precisión; los objetos se deben definir mediante procedimientos finitos y verificables. En particular, las definiciones impredicativas no son válidas. 4. La existencia de los objetos matemáticos depende de la posibilidad de construcción de los objetos mismos; por tanto, “existen” sólo aquellos seres matemáticos que son construidos. En particular, el axioma de elección es inaceptable: los objetos por él introducidos no satisfacen la exigencia de ser el resultado de una construcción. Junto con la condena del infinito actual, otro punto central en la postura de Brouwer es la exclusión de las pruebas de existencia por reducción al absurdo, pues en ellas no se indica la manera de construir el objeto. Esto trajo como consecuencia la restricción del principio del tercero excluido –sobre el que se basan estas pruebas– a conjuntos finitos. De ahí la siguiente tesis: 5. El principio del tercero excluido no siempre es válido con relación a proposiciones en las que se hace referencia a conjuntos infinitos. Como se ve, Brouwer se arroga la tarea de hacer a un lado toda la matemática existente para edificarla de nuevo, esta vez utilizando sólo conceptos y modos de inferencia con una clara justificación intuitiva. Esta postura constituyó un exceso a los ojos de muchos matemáticos. En el punto de partida ni siquiera la lógica está prejuzgada; más bien, los principios lógicos se habrían de esclarecer una vez avanzado lo suficiente el programa de reconstrucción y sólo entonces se podría comparar la lógica intuicionista con la clásica (cosa que hicieron, en gran medida, Heyting y Gödel, entre otros). En lo que sigue examinaremos con mayor detenimiento el problema del tercero excluido, de vital importancia para Hilbert. 3.8.1. El principio del tercero excluido En 1908 Brouwer publicó un trabajo titulado De onbetrouwbaarheid der logische principes (La inseguridad de los principios de la lógica)106 en el que pone en duda la creencia de que los principios de la lógica clásica tienen una validez absoluta, sin tomar en cuenta el dominio en el que se les aplica. Su crítica se centra primordialmente en el uso que se le da al principio del tercero excluido con relación a totalidades infinitas. Desde su punto de vista la extensión de algunos principios lógicos al dominio de los conjuntos infinitos es ilegítima, y como prueba aduce la aparición de las antinomias: si éstas se han producido es porque, ciegamente, se siguen aplicando las reglas de la 106 V. Brouwer, 1908. 3.8. E L INTUICIONISMO DE B ROUWER 183 lógica clásica a los conjuntos infinitos, siendo que éstas nacieron de la matemática de conjuntos finitos: Además, la función de los principios lógicos no es la de dirigir los razonamientos matemáticos aplicados a las realidades empíricas, sino describir, en el lenguaje de los razonamientos, las regularidades que han sido observadas. Si uno se expresa en el lenguaje siguiendo dichas regularidades y pierde el contacto con los sistemas matemáticos, corre el riesgo de caer en paradojas como la de Epiménides.107 Para Brouwer, la matemática no está obligada a respetar ningún principio lógico con anterioridad a su desarrollo –no hay principios lógicos a priori–, pues es la construcción, no la experiencia, la que determina su corrección.108 Un par de ejemplos nos ayudarán a clarificar esta cuestión. El primero es el siguiente. Todos conocemos el principio de que el todo es mayor que la parte, cuyo origen se remonta a la matemática de los conjuntos finitos.109 Como sabemos, este principio deja de ser válido en el dominio de las totalidades infinitas si por “conjuntos de igual magnitud” entendemos “conjuntos cuyos elementos se pueden poner en correspondencia uno a uno”. Así, por ejemplo, el principio no se cumple en el caso de los números naturales y los números cuadrados, como lo descubriera Galileo en 1638 (véase el apéndice F). Si bien hoy en día el principio anterior no se considera parte de la lógica, éste nos permite ilustrar a la perfección lo que queremos decir: que algunos principios considerados por un largo tiempo como universales, pueden muy bien no ser válidos en algún dominio. Es en este sentido que se pone en duda la validez del principio del tercero excluido, cuyo uso en la matemática debemos aclarar. En su forma general se le puede enunciar como sigue: Principio del tercero excluido. Para toda proposición P, o P es verdadera o su negación ¬P es verdadera, no habiendo una tercera posibilidad frente a estas dos; en símbolos: P ∨ ¬P.110 El rechazo de este principio supone una lectura distinta de la negación. Para Brouwer, una expresión como “¬P” se lee “es absurdo que P” o “es contradictorio que P”. 107 Brouwer, 1908. Cita tomada de Largeault, 1992, p. 19. podemos examinar en plenitud las ideas de Brouwer acerca de la lógica y la matemática en general, pues ello supone un trabajo de mayor o igual extensión que el presente. Por el contrario, nos habremos de limitar a aquellos aspectos relacionados con el programa y la concepción que Hilbert tiene de la matemática, aunque la imagen transmitida de su pensamiento sea esquemática y quizá distorsionada. Al respecto, una dificultad que hay que enfrentar es el peculiar estilo de exposición de Brouwer, un tanto oscuro en ocasiones, y el hecho de que la matemática que propone es “otra matemática”, con resultados radicalmente distintos, e inmersa en un lenguaje y conceptos propios que en ocasiones no comparte con la primera. 109 Como hemos visto, Euclides incluye este principio como una noción común en los Elementos. 110 El otro principio tradicional de la lógica clásica es el Principio de no contradicción: para toda proposición P, es imposible que P y ¬P sean ambas verdaderas; en símbolos: ¬(P ∧ ¬P). 108 No 184 3. L A CUESTIÓN DE LOS FUNDAMENTOS ... Desde este punto vista, los enunciados ¬¬P y P no son necesariamente equivalentes, pues en el primer caso lo que se tiene es la afirmación de que es absurdo que sea absurdo que P, lo cual no significa que P, ya que esta última afirmación debería estar respaldada por una construcción. Por ejemplo, puede ser el caso que ¬¬P se haya obtenido suponiendo ¬P y derivando de ahí una contradicción, en cuyo caso no se cuenta con una construcción. Así, el principio del tercero excluido no se considera una ley universal, al no cubrir P ∨ ¬P todas las posibilidades: el que ¬P sea contradictorio no garantiza que se pueda respaldar P con una construcción.111 Brouwer también rechaza la demostración por reducción al absurdo cuando se trata de probar la existencia de un objeto matemático con relación a una totalidad infinita. En esto contrasta con la matemática clásica, que admite la existencia de cualquier entidad cuya no existencia se refuta. Esto no es válido para Brouwer: refutar la no existencia de un objeto no es lo mismo que probar la posibilidad de construirlo, como reclama el intuicionismo. Para aclarar lo anterior, consideremos lo siguiente. Sea C un conjunto y A(x) una propiedad aplicable a los elementos de C. Si nos limitamos a C, la proposición ∃xA(x) afirma que algún elemento de C tiene la propiedad A. En este caso el principio del tercero excluido aplicado a ∃xA(x) da como resultado ∃xA(x) ∨ ¬∃xA(x). Supongamos que la propiedad A es decidible, es decir, que para cada elemento de C se puede determinar de manera efectiva si la propiedad se cumple o no para él. Cuando el conjunto C es finito, el principio establece un hecho inobjetable: examinando uno tras otro los elementos de C o bien encontraremos un miembro de él que tiene la propiedad A, en cuyo caso se cumplirá la alternativa ∃xA(x), o bien comprobaremos que ningún miembro de C tiene dicha propiedad, en cuyo caso se cumplirá la alternativa ¬∃xA(x). Por tanto, a pesar de las dificultades que pudiera ofrecer, la tarea de verificar si algún elemento de C tiene la propiedad A es en principio realizable. Es por ello que Brouwer considera que la ley del tercero excluido es válida para toda propiedad decidible con relación a conjuntos finitos.112 111 En realidad, Brouwer no afirma que el principio del tercero excluido siempre falla, sino que puede fallar en presencia de un conjunto infinito. Por ejemplo, dado un par de números enteros h y k, siempre se puede decidir si h = k o si h = k. Por tanto, con relación al acto de comparar entre sí números enteros podemos decir que el principio es válido, y escribir: Si h y k son números enteros, entonces h = k ∨ ¬(h = k) Sin embargo, en el caso de los números reales cabe la posibilidad de definir de manera aceptable para el intuicionismo dos números que no se pueden comparar, pues para ello habría que conocer un número infinito de dígitos de su expansión decimal. Por tanto, con relación a la igualdad de los números reales no podemos afirmar la validez del principio del tercero excluido (en el apéndice H se expone un tercer argumento en contra de este principio). De hecho, es en el terreno de la teoría de los números reales, y por consiguiente en el análisis, donde Brouwer diverge de manera esencial de la teoría clásica, mientras que en la esfera de los números enteros la aritmética que propone es una parte propia de la aritmética clásica. La prueba de este hecho se encuentra en (Gödel, 1932). 112 V. Brouwer, 1923, en Heijenoort, 1967, p. 336. Al respecto, Brouwer concluye que también la ley de la doble negación se cumple con relación a los conjuntos finitos: ¬¬A → A (idea que él expresa en 3.8. E L INTUICIONISMO DE B ROUWER 185 Pero ¿podríamos decir lo mismo en el caso de los conjuntos infinitos? Supongamos que C es infinito. Si bien aun podemos decidir para cada elemento de C si la propiedad A se cumple o no para él, en este caso estamos impedidos de revisar todos los elementos de C en busca de uno que sí la tenga, pues esto implica un búsqueda infinita; en otra palabras: puede suceder que por más que alarguemos la búsqueda, sigamos sin encontrar un elemento de C con tal propiedad, sin que por ello estemos autorizados a decir que no lo hay (quizá no hemos ido suficientemente lejos en la búsqueda), ni a decir que sí lo hay (pues no conocemos ninguno que la tenga). En tal caso, dice Brouwer, no podemos afirmar la alternativa que ofrece el principio del tercero excluido, pues tal afirmación no está respaldada por una construcción o por una revisión exhaustiva.113 Claro está que un cantoriano diría que esto último es en cierto sentido irrelevante, pues o sucede que hay un elemento de C con la propiedad A, en cuyo caso se cumple la alternativa ∃xA(x), o sucede que no hay tal elemento, en cuyo caso se cumple la alternativa ¬∃xA(x). No obstante, para Brouwer el sentido que los cantorianos le dan a los términos “hay” y “no hay” es equívoco, pues en su uso dan a entender que el conjunto C simplemente “está ahí”, en espera de que las propiedades de sus elementos sean descubiertas y que en él se encuentran o no objetos con la propiedad A, independientemente de que los conozcamos. Hablar así, diría, es platonismo puro, como si el conocimiento matemático fuera acerca de entidades que tienen una existencia autónoma, y no acerca de construcciones mentales.114 La reducción al absurdo. Veamos cómo se puede demostrar en la matemática clásica un teorema existencial de la forma ∃xA(x) con base en el principio del tercero excluido. El método es el de reducción al absurdo, que consiste en suponer como hipótesis la negación de lo que se quiere demostrar –en este caso la hipótesis ¬∃xA(x)– y deducir de ella una contradicción, es decir, una proposición de la forma Q ∧ ¬Q. Supongamos que tal ha sido el caso, y que de ¬∃xA(x) se ha deducido Q ∧ ¬Q. Como la conclusión alcanzada va en contra del principio de no contradicción (véase la nota al pie número 111), la hipótesis ¬∃xA(x) se rechaza, y es entonces que entra en escena el otro lenguaje, y con otros conceptos, bajo el nombre de principio de la reciprocidad de las especies complementarias: “es decir, el principio de que para cada sistema, la corrección de una propiedad se sigue de la imposibilidad de la imposibilidad de esa propiedad.” La cita corresponde al mismo lugar. 113 Un ejemplo concreto es el siguiente: en la terminación decimal de π ¿aparece el dígito 5 cien veces seguidas, es decir, en forma consecutiva? Es, desde luego, concebible que así sea, pero, para poder afirmar que tal es el caso, habría que señalar dónde se encuentra dicha sucesión y esto es, precisamente, algo que nadie ha podido hacer. La otra alternativa desde el punto de vista clásico es demostrar, por reducción al absurdo, que tal sucesión existe, procedimiento inaceptable para el intuicionismo. Ello se debe a la imposibilidad de aludir a la ley del tercero excluido, que impone uno de los términos de una alternativa aunque se ignore cuál de ellos es el verdadero, en un dominio en el que no se puede alcanzar una u otra conclusión en un número finito de etapas. 114 En realidad, la crítica de Brouwer nos brinda la ocasión de entender, por contraste, lo proclive que es la matemática clásica al platonismo (al postular, como lo hacen Hilbert y Zermelo, ciertas entidades primitivas de las que se exige satisfagan ciertos axiomas), así como el carácter no constructivo de la matemática hilbertiana, donde la existencia se identifica con la no contradicción, una noción de existencia un tanto inusual. 186 3. L A CUESTIÓN DE LOS FUNDAMENTOS ... principio del tercero excluido. De la alternativa ∃xA(x) ∨ ¬∃xA(x) sabemos que el término de la derecha es imposible, por lo que gráficamente tenemos la siguiente situación: ¬∃xA(x) ∃xA(x) ∨ Como se ve, la única posibilidad restante es la proposición ∃xA(x), que así queda demostrada. La objeción de Brouwer es obvia: ¿cómo decir que un objeto existe sin haberlo construido o sin saber cómo se le puede construir? En casos como éste la reducción al absurdo lo que produce es una contradicción, no un objeto, y esto en nada se parece a una construcción.115 Dice Brouwer: A las leyes de la lógica teórica, incluyendo el principio del tercero excluido, se les adscribió con tal persistencia un carácter a priori, que hasta hace poco fueron aplicadas sin reserva incluso en la matemática de los sistemas infinitos, esto sin que nos preocupara la cuestión de que los resultados así obtenidos no están abiertos, tanto teórica como prácticamente, a ninguna corroboración empírica en general. Sobre esta base se construyeron extensas teorías incorrectas, especialmente en el último medio siglo.116 Años más tarde Brouwer se referiría satíricamente a la aceptación del principio del tercero excluido con las siguientes palabras: La larga creencia en la validez universal del principio del tercero excluido en matemáticas es considerada por el intuicionismo como un fenómeno en la historia de la civilización del mismo tipo que la antigua creencia en la racionalidad de π o en la rotación del firmamento en torno a un eje que pasaba por la Tierra.117 115 En efecto, una demostración constructiva de la existencia de un objeto matemático seria la construcción de un ejemplo tangible del mismo, mientras que una demostración no constructiva consistiría en probar que su no existencia nos llevaría a una contradicción. En el primer caso tendríamos un objeto tangible, mientras que en el segundo no. En el análisis clásico son muy frecuentes las pruebas no constructivas o indirectas, muchas de las cuales, por su misma naturaleza, no se pueden convertir en demostraciones directas. Tal es el caso, por ejemplo, del teorema del valor medio. Dada la función exp(senx) y el intervalo [1, π], ¿cuál es el valor medio en este caso? Por otra parte, cabe señalar que el intuicionismo sí acepta el método de reducción al absurdo para demostrar la inexistencia de un objeto, es decir, para demostrar un enunciado de la forma ¬∃xA(x) (v. gr., √ la prueba de que 2 es irracional). 116 Brouwer, 1923. Cita tomada de Heijenoort, 1967, p. 336. Obviamente, Brouwer se está refiriendo a la teoría cantoriana de conjuntos y al análisis matemático clásico. 117 Brouwer, 1948. Cita tomada de Benacerraf, 1964, p. 82. 3.8. E L INTUICIONISMO DE B ROUWER 187 Si bien la crítica de Brouwer a las leyes de la lógica clásica es mucho más compleja de lo que hemos expuesto, con lo dicho debe quedar claro que la aceptación de su propuesta equivalía a suprimir partes considerables de la matemática clásica, tributo que Hilbert no estaba dispuesto a pagar.118 Para él, el método de prueba por reducción al absurdo es una conquista irrenunciable, y basta con demostrar que una proposición de la forma ¬∃xA(x) implica contradicción para asumir la existencia de una entidad matemática con la propiedad A (pues se tiene que ¬¬∃xA(x) es equivalente a ∃xA(x)). 3.8.2. Comentarios generales La matemática intuicionista es una dirección firmemente establecida hoy en día, con una propuesta original que la aleja de la forma habitual de “hacer matemáticas” y con ideas y resultados que le son propios. Para concluir esta sección queremos insistir en algunos aspectos de esta tendencia, sobre todo con relación a los fundamentos de la matemática, esfera en la que no ha dejado de ejercer su influencia. 1. El rechazo del principio del tercero excluido por parte del intuicionismo implica a su vez el rechazo de la ley de la doble negación, que podemos formular así: de la doble negación de una proposición se sigue la proposición misma (en símbolos: ¬¬P → P). En la formalización de la lógica intuicionista que hace Arend Heyting, ninguna de dichos principios (que son equivalentes) es deducible en el sistema. De hecho, la lógica proposicional intuicionista se puede describir como la lógica proposicional clásica sin el principio aristotélico del tercero excluido, pero con la ley de contradicción, expresada por la fórmula (¬A → (A → B)): de una proposición y su negación se sigue cualquier cosa. 2. Otra de las razones por las que Brouwer rechaza el principio del tercero excluido es que en su opinión asumirlo equivale a suponer que todo problema matemático tiene solución, lo cual le parece inadmisible: Consideremos el principio del tercero excluido: éste exige que toda hipótesis sea matemáticamente verdadera o no verdadera: que para cada supuesto acoplamiento de sistemas bien determinados uno respecto al otro, esta construcción o bien puede ser llevada a término o bien es imposible llevarla a cabo. La cuestión de la validez del principio del tercero excluido equivale entonces a la de la posibilidad de problemas matemáticos no resolubles. En cuanto a la convicción a veces expresada de que no hay ningún 118 En 1927 Hilbert se refiere a la propuesta de Brouwer con las siguientes palabras: “Quitar al matemático el principio del tercero excluido sería lo mismo, digamos, que prohibir al astrónomo el uso del telescopio o al boxeador que use sus puños. Prohibir los enunciados [puramente] existenciales y el principio del tercero excluido es equivalente a renunciar a la ciencia matemática por completo.” [Hilbert 1927, p. 476]. 188 3. L A CUESTIÓN DE LOS FUNDAMENTOS ... problema matemático no resoluble, no existe a la fecha ni la sombra de una prueba de tal hecho.119 Las últimas palabras están dirigidas a Hilbert, quien en 1900, en la misma ocasión en que propusiera su famosa lista de 23 problemas, había proclamado su convicción de que todo problema matemático es resoluble, renovando con ello una esperanza epistemológica: la de la inexistencia de límites para la razón matemática. Al respecto, aquí no habremos de abordar este tema, cosa que haremos a partir de la sección 4.1.1. Lo único que diremos al respecto es que nos parece sorprendente que Brouwer, casi un cuarto de siglo antes de la aparición de los teoremas de Gödel, se opusiera a la idea de que todo problema matemático es resoluble, aunque sobre una base distinta: para él, demostrar que es absurdo suponer que una construcción es imposible (es decir, probar la negación de la negación de una proposición P), no significa que tal construcción sea realizable. Por el contrario, para afirmar que lo es, el único camino es llevarla a cabo o indicar cómo llevarla a cabo, y la reducción al absurdo no otorga ninguna garantía de esto último. 3. Como hemos visto, Brouwer considera que una de las causas de la aparición de antinomias en la teoría de conjuntos es el mal uso de algunos principios lógicos. Al respecto dice lo siguiente: “La lógica clásica fue abstraída de la matemática de conjuntos finitos y, desatenta a su humilde origen, creyó que estaba por encima de toda la matemática, y se aplicó, sin justificación alguna, a la matemática de los conjuntos infinitos. Ésta es la caída y el pecado original de la matemática por el que fue justamente castigada por las antinomias.”120 Ciertamente, la matemática clásica otorga validez universal a los principios de la lógica, y se apoya en ellos de manera decidida para extender el conocimiento. En franca oposición a esta postura se encuentra el intuicionismo, que sostiene que al trabajar en un campo completamente nuevo, sobre todo donde intervienen magnitudes infinitas, no se puede estar seguro de que todavía se aplicarán los principios de la lógica tradicional, debiéndose en tales casos encontrar la lógica apropiada abstrayendo los patrones lógicos observables. Por tanto, restringe el empleo de los principios lógicos a aquellas áreas donde han probado su validez. 4. Brouwer también relaciona el origen de las antinomias con los principios de la teoría cantoriana de conjuntos, por lo que la rechaza por completo. Su principal objeción es que en esta teoría se alude a nociones que no se pueden construir en la intuición, como es el caso del infinito actual. En 1912 se refiere a esta teoría con las siguientes palabras: En el dominio de los conjuntos finitos, en el que los axiomas formalistas tienen una interpretación perfectamente clara para los intuicionistas, hay un franco acuerdo entre las dos tendencias en los resultados, mas no en los 119 Brouwer, 120 Brouwer, 1908. Cita tomada de Largeault, 1992, p. 21. 1908. Cita tomada de la traducción al inglés, p. 110. 3.8. E L INTUICIONISMO DE B ROUWER 189 métodos; no obstante, esta situación cambia de raíz en el dominio de los conjuntos infinitos o transfinitos, donde, principalmente con la aplicación del axioma de inclusión,121 [...] los formalistas introducen varios conceptos sin ningún significado para el intuicionista, como, por ejemplo, “el conjunto cuyos elementos son los puntos del espacio”, “el conjunto cuyos elementos son las funciones continuas de una variable”, “el conjunto cuyos elementos son las funciones discontinuas de una variable”, etc. En el curso de estos desarrollos formalistas resulta que la aplicación sostenida del axioma de inclusión conduce inevitablemente a contradicciones. Un claro ejemplo de este hecho es la llamada paradoja de Burali-Forti.122 Más adelante, al referirse a la forma en que Zermelo enuncia el principio de comprensión en su teoría axiomática (bajo el nombre de axioma de separación, véase la sección 3.5), añade: De esta manera el axioma [de separación] permite sólo la introducción de conjuntos que sean subconjuntos de conjuntos previamente introducidos; si uno desea operar con otros conjuntos, su existencia debe ser postulada explícitamente. No obstante, puesto que para llevar a cabo cualquier cosa se debe postular desde un inicio la existencia de cierta colección de conjuntos, el único argumento válido que se puede esgrimir en contra de la introducción de un nuevo conjunto es que éste conduzca a contradicciones; en realidad, la única modificación a que ha dado lugar el descubrimiento de paradojas en la práctica del formalismo ha sido la abolición de aquellos conjuntos que dan lugar a ellas. Se sigue operando sin cuidado sobre la base del viejo axioma de inclusión; el resultado es que amplios sectores de investigación, carentes de significado para el intuicionismo, siguen teniendo un considerable interés para el formalismo. Un ejemplo de ello es la teoría de potencias [la aritmética cardinal].123 Este rechazo, junto con el de las definiciones impredicativas y aquellas proposiciones en que intervienen conjuntos o sucesiones infinitas consideradas como un todo, resulta en un final desolador para los defensores de la matemática clásica: una rigurosa aplicación de los principios propuestos por Brouwer conducía directamente al abandono de partes considerables de la misma. En particular, resultaría imposible la construcción del continuo numérico tal como lo hace Dedekind. 5. En la matemática clásica la noción de consistencia tiene precedencia sobre la noción de construcción, haciendo que las cosas “existan” incluso cuando no las podemos ver o exhibir. Por el contrario, en la matemática intuicionista la noción de construcción tiene prioridad sobre la noción de consistencia, de modo que 121 Brouwer se refiere bajo esta denominación al principio de comprensión. 1912. Cita tomada de Benacerraf, 1964, pp 71-72. 123 Brouwer, op. cit., p. 73. 122 Brouwer, 190 3. L A CUESTIÓN DE LOS FUNDAMENTOS ... algunos enunciados pueden quedar sin decidir, quizá por siempre, a causa de la imposibilidad de llevar a cabo una construcción.124 Lo que está en juego no es la matemática, sino el significado de la palabra “existencia” en un sentido matemático. En este sentido, Hilbert identifica el dominio de lo “existente” con el dominio de lo posible; mas como la posibilidad de un concepto depende de la no contradicción, lo que en realidad hace es colocar los principios de la lógica tradicional como base de la noción de existencia matemática; Brouwer por su parte se abstiene de estudiar objetos cuya existencia no es un hecho en el dominio de la intuición pura. 6. A diferencia de la matemática clásica, el intuicionismo interpreta los conectivos lógicos como instrucciones sobre cómo lograr una prueba constructiva de todo enunciado que los comprenda. Por ejemplo, un enunciado como ¬P se entiende como la afirmación de que “la construcción referida en P no da el resultado esperado”, es decir, como la afirmación de una imposibilidad, a la que se refiere comúnmente hablando de lo absurdo que resulta P, o bien como una construcción hipotética que desemboca en una contradicción. Para entender correctamente esta interpretación, recordemos que la lógica intuicionista sólo alude a razonamientos o experiencias mentales, afirmando que ciertas construcciones se pueden o no llevar a cabo. Por ejemplo, un enunciado como “7 + 5 = 12” se debe entender como una abreviatura del enunciado “He realizado las construcciones indicadas por 7 + 5 y 12 y he encontrado que el resultado es el mismo”, lo cual expresa un hecho empírico, a saber, que se ha llevado a cabo con éxito una doble construcción mental y los resultados coinciden. En cambio, una negación como “2 + 1 = 3 + 1” se debe entender como “he realizado las construcciones mentales indicadas por 2 + 1 y 3 + 1 y he encontrado que el resultado no es el mismo”, lo cual expresa una imposibilidad: la de llegar a lo mismo mediante las construcciones indicadas. Por tanto, la negación está referida en este caso a una doble construcción que fracasa en su intento o, mejor dicho, a dos construcciones que no concluyen en lo que se afirma. Ergo, negar un enunciado como “2 + 1 = 3 + 1” es una notificación, no acerca del modo de ser de ciertos objetos preexistentes, sino acerca de ciertas construcciones mentales, y equivale a afirmar que algo es absurdo: a saber, que los resultados de tales construcciones son de cierta manera.125 7. El intuicionismo difiere del logicismo en que trata a la lógica (tal como la entiende) como una parte de las matemáticas, no como su fundamento, y del platonismo en que considera a los objetos matemáticos como construcciones mentales sin ninguna existencia independiente; es afín con el constructivismo de Kronecker y sobrepasa al finitismo extremo, según el cual los conjuntos infinitos no existen ni 124 Grosso modo, la matemática constructiva es aquella que no rebasa los límites que nos impone la experiencia. 125 V. Franchella, 1995. 3.8. E L INTUICIONISMO DE B ROUWER 191 siquiera de manera potencial.126 Al respecto, Brouwer admite ciertos números ordinales transfinitos como, por ejemplo, el número ω, aunque no acepta la existencia de números cardinales superiores a ℵ0 .127 8. Lejos de lo que Hilbert propone, Brouwer procede al margen de la pauta axiomática y sin preguntarse por la consistencia de sus teorías, pues considera que la construcción matemática es tan inmediata y sus resultados tan claros al entendimiento, que no requiere de ningún fundamento, cualquiera que éste sea. Es en este contraste donde podemos apreciar el papel de la lógica tradicional en la matemática clásica, en la que a pesar de su falta de evidencia se le adscribe una validez universal. Vindicar su uso es la tarea que Hilbert se echa a cuestas: “Es absolutamente necesario alcanzar en los modos de inferencia el mismo grado de seguridad que el que existe en la teoría ordinaria elemental de los números, en el que todo mundo confía plenamente y en el que una paradoja o una contradicción sólo pueden surgir por nuestra falta de atención.”.128 Ante la reacción de Brouwer, Hilbert opuso la suya propia: a fin de cuentas, su fe en el método axiomático no sufrió ningún quebranto en el lapso transcurrido entre 1904 y 1917, año en que retomó el problema de los fundamentos. Para salir victorioso en esta contienda debía responder a las críticas de Brouwer de manera aceptable a los ojos de la comunidad matemática y llevar a feliz término su proyectada prueba de consistencia, retos que asumió cuando Hermann Weyl hizo eco de las palabras de Brouwer. Esta necesidad lo llevó a profundizar aún más en la naturaleza del pensamiento matemático. Una vez aclarado el contexto en que Hilbert retomó el problema de los fundamentos, atendamos la edificación de su programa de fundamentación de los años veinte. 126 Aun más radical es la posición del ultrafinitismo, que sostiene que incluso los números muy grandes no existen, digamos aquellos mayores que 10100 . 127 V. Brouwer, 1912, en Benacerraf 1964, pp. 73-74. 128 Hilbert, 1925. Cita tomada de la traducción al español, p. 94. Capítulo 4 El programa de Hilbert 4.1. Los inicios Durante más de una década Hilbert desatendió (al menos públicamente) el problema de los fundamentos de la matemática, quizá por la falta de un plan bien definido para llevar a cabo la anhelada prueba de consistencia. Durante ese tiempo dirigió sus esfuerzos a la física, donde se ocupó de la teoría general del campo y de la mecánica cuántica. Fue entonces que introdujo los ahora llamados espacios de Hilbert, una herramienta teórica de vital importancia en el área. Finalmente, en 1917 retomó el tema de los fundamentos en una conferencia que presentó ante la Sociedad Matemática Suiza bajo el nombre de “El pensamiento axiomático”1 . Muchas cosas habían sucedido entre tanto: la publicación de Principia Mathematica por parte de Russell y Whitehead, la irrupción de Brouwer en la escena con sus agudas críticas a la matemática clásica y, dentro de un marco más general, la aparición de la teoría general de la relatividad. Más allá de la actividad científica, Alemania estaba envuelta en la Primera Guerra Mundial, cuyo fin llegaría un año más tarde, en noviembre de 1918. En esta ocasión Hilbert dirigió sus reflexiones no sólo a la matemática, sino a la ciencia en general, adoptando la idea de que las más importantes teorías científicas se deberían reconstruir cual teorías matemáticas, es decir, con base en el método axiomático. Propone entonces fijar los conceptos y principios básicos de cada una de ellas para después probar su consistencia, pues considera indispensable asegurar la coherencia de cada sistema. Su tesis es que dicha tarea recae directamente en la matemática, pues atribuye a esta ciencia la tarea de investigar tales cuestiones. Menciona disciplinas como la termodinámica, la mecánica clásica y la teoría cinética de los gases, señalando los vínculos que algunas de ellas guardan con la teoría de los números reales, de la cual se sirven. Este proyecto, el de la axiomatización de la física, tuvo pocos seguidores y muy poca importancia en el siglo veinte. En cuanto a la axiomática, la idea que 1 Hilbert, 1917. 193 194 4. E L PROGRAMA DE H ILBERT ofrece Hilbert no es muy distinta de la de 1899, donde mira las teorías como redes de relaciones entre objetos no especificados. Como veremos, este punto de vista lo habría de modificar en la siguiente década. Al referirse a la matemática reitera que en el caso de los axiomas para los números enteros y para la teoría de conjuntos ya no es posible probar su consistencia exhibiendo un modelo, pues no existe ninguna disciplina más simple a la que se pueda apelar. Es entonces que, en un desliz russelliano, sugiere probar que las teorías de los números y de conjuntos son parte de la lógica, la cual ya ha sido axiomatizada por Russell y Whitehead en lo que constituye, en su opinión, un punto culminante de la tarea axiomática en general. Pese a este momentáneo desvío hacia el logicismo, Hilbert señala que lo hecho por Russell deja abierta una serie de cuestiones asociadas al problema de la consistencia, las cuales poseen un gran contenido teórico-cognoscitivo. Señala cinco de ellas, no todas de la misma importancia: 1. La cuestión de la resolubilidad de cualquier problema matemático, 2. La cuestión de la decidibilidad de un problema matemático por medio de un número finito de operaciones lógicas, 3. La cuestión de las relaciones entre el contenido concreto y la formalización en la matemática y en la lógica, 4. La cuestión de la sencillez de las demostraciones matemáticas, y 5. La cuestión de la posibilidad de ulterior control de los resultados de una investigación matemática (sic). Obviamente, estos problemas no son de la misma índole, siendo poco claro a qué se refiere Hilbert con el quinto de ellos. Ahora bien, ante lo que estamos es ante una serie de interrogantes que, junto con el problema de la consistencia, fueron determinantes en el curso que habría de seguir la lógica matemática en el siglo veinte, y que incentivaron nuevas controversias filosóficas en torno a la matemática.2 En cuanto a la fascinación que ejerciera el programa logicista sobre Hilbert, ésta fue efímera: muy pronto Hilbert retomó la idea de desarrollar simultáneamente la 2 Asociadas a los cuatro primeros problemas enumerados por Hilbert y al de la consistencia se hallan, al menos, la teoría de algoritmos, las máquinas de Turing y de Post, la teoría de la demostración, la inteligencia artificial, la teoría de modelos, la filosofía de la mente, la filosofía del lenguaje y, en forma más general, la ontología y la epistemología matemática. En particular, el tercero de ellos nos remite a un enjambre de problemas que se hallan al centro de la filosofía de las matemáticas: la naturaleza de la lógica, la relación entre lo formal y lo intuitivo, los lazos entre el lenguaje y el pensamiento y la posibilidad de mecanizar el pensamiento matemático. 4.1. L OS INICIOS 195 lógica y la matemática en oposición a la idea de reconstruir la segunda al interior de la primera. No obstante, del trabajo de Russell y Whitehead hubo de conservar algunas herramientas que le permitirían franquear las limitaciones de su trabajo de 1904, especialmente la lógica de predicados con sus artificios simbólicos. De algún modo, Hilbert vio en la formalización de la lógica un medio para convertir la prueba matemática en un objeto de estudio y alcanzar la proyectada prueba de consistencia. Al final del escrito Hilbert reitera la importancia de someter la demostración matemática a un detallado estudio con las siguientes palabras: Todos los problemas básicos que he caracterizado, de entre los cuales el último que he mencionado no es sino uno más [el de la decidibilidad por medio de un número finito de operaciones], conforman un nuevo campo de investigación. Su exploración y desarrollo requieren esencialmente de un estudio a fondo del concepto de demostración matemática, de manera análoga a como el astrónomo está obligado a considerar el movimiento de su punto de referencia, el físico a preocuparse por la teoría de sus instrumentos y el filósofo a hacer una crítica de la razón.3 Fue hasta 1922 que Hilbert emprendió el desarrollo de estas y otras ideas, apremiado por el recrudecimiento de los debates ocasionado por Weyl. Su propósito era resolver en definitiva el problema de los fundamentos de la matemática, lo cual exigía: revisar críticamente todo lo hecho hasta entonces en ese dominio, analizar las ideas de las otras escuelas y esclarecer la naturaleza de la matemática clásica, someter a escrutinio los principios de la lógica, aclarar el sostén epistemológico de su proyecto de fundamentación, reconsiderar la postura de Kant frente a la matemática y precisar el lugar del a priori en esta disciplina y, por supuesto, elaborar un plan definido para la prueba de consistencia, incluyendo los medios para llevarla a cabo. Entre otras cosas Hilbert imaginó que la naciente teoría de la demostración daría sostén a su creencia en la resolubilidad de todo problema matemático, e incluso llegó a creer que con ella podría probar la hipótesis del continuo de Cantor. El cumplimiento de todo lo anterior se dio en forma gradual, dadas las muchas aristas del problema. Para alcanzar sus metas Hilbert debió atraer a un grupo de académicos que lo ayudarían a afinar las herramientas lógicas necesarias y a ahondar en las 3 Hilbert, 1917, p. 34. 196 4. E L PROGRAMA DE H ILBERT bases filosóficas de su proyecto. Entre quienes colaboraron en esta empresa, conocida posteriormente como Programa de Hilbert, podemos mencionar a Wilhelm Ackermann, Paul Bernays, John von Neumann y, más adelante, Jacques Herbrand y Gerhard Gentzen. Al respecto, los avances fueron dados conocer en una serie de artículos, libros y conferencias diseminados a lo largo de más de una década.4 4.1.1. La cuestión de la resolubilidad de todo problema matemático (parte 1) Un tema muy poco comentado con relación al programa de Hilbert es el relativo a la resolubilidad de todo problema matemático. Ofrecer una prueba de ello o, al menos, un argumento fehaciente a su favor, fue una de las preocupaciones que, junto con la cuestión de la consistencia, impulsaron la conformación del programa. Hilbert siempre sostuvo que todo problema matemático era susceptible de una solución exacta. Un claro ejemplo de ello lo tenemos en el discurso pronunciado en 1900 ante el pleno del Segundo Congreso Internacional de Matemáticas celebrado en París, donde mantiene que no hay tal cosa como un problema matemático irresoluble. Esta clase de afirmaciones no eran circunstanciales; es más, ahora sabemos que desde su época como estudiante en la universidad de Königsberg, Hilbert solía discurrir acerca de estas cuestiones con su amigo Hermann Minkowski. Retrocedamos a 1900, a la conferencia dictada ante el pleno de Segundo Congreso Internacional de Matemáticas celebrado en la ciudad de París. Sabemos que al recibir la invitación para asistir al evento como conferencista principal, Hilbert titubeó entre abordar la relación entre las matemáticas y la física, un tema que Poincaré había examinado tres años atrás, o explorar la cuestión de los problemas matemáticos. Finalmente se decidió con base en una sugerencia del propio Minkowski: “Sería más atractivo mirar hacia el futuro, enumerando una lista de problemas en los que los matemáticos habrían de ponerse a prueba durante el siglo venidero”.5 Se trata quizá de la conferencia más renombrada en la historia de las matemáticas. El título que le dio fue muy simple: “Problemas matemáticos”, un tema que venía muy bien con el cambio de siglo y una buena excusa para reflexionar en torno a las matemáticas y su futuro.6 Fue ahí donde Hilbert hubo de presentar y analizar su famosa lista de 23 problemas individuales cuya resolución, pensaba, contribuiría al avance de las matemáticas en el siglo veinte.7 La convicción de Hilbert En un encendido pasaje, Hilbert parte de la sugerencia de Minkowski para adentrarse en nuestro anhelo por vislumbrar el futuro: 4 Los trabajos señalados incluyen a Hilbert 1922, 1922a, 1925, 1927, 1928, 1930, 1930a , 1934 y 1939. 1970, p. 69. 6 Hilbert, 1900. 7 V. (Browder, 1976) y (Kantor, 1996). 5 Reid, 4.1. L OS INICIOS 197 ¿Quién de nosotros no se alegraría al descorrer el velo que oculta al futuro, y lanzar una mirada a los próximos avances de nuestra ciencia y a los secretos de su desarrollo en los siglos venideros? ¿Hacia qué metas específicas tenderán los espíritus matemáticos más preeminentes? ¿Qué nuevos métodos y nuevos hechos en el amplio y fértil terreno del pensamiento matemático traerán consigo los nuevos tiempos? [...] Pues el cierre de una gran época no sólo nos invita a mirar hacia el pasado, sino a dirigir nuestros pensamientos hacia el futuro.8 Para Hilbert, una manera de mirar hacia el futuro de las matemáticas es a través de sus problemas. De hecho, cada etapa de la historia de las matemáticas se caracteriza por ciertos problemas que estimularon la creación de nuevos métodos, y por algunos otros que no se pudieron resolver. “Es mediante la solución de problemas que el investigador pone a prueba el temple de su acero; encuentra nuevos métodos y nuevos discernimientos, y gana un horizonte más amplio y libre.”9 Los problemas pueden provenir de cualquier parte, pero una vez que ingresan al dominio de la matemática pura se les debe resolver mediante el pensamiento, sin otra ayuda que la de la lógica y la imaginación.10 Esto, dice Hilbert, marca la diferencia entre las matemáticas y el resto de las ciencias. Obviamente, puede suceder que al tratar de resolver un problema, todos los intentos estén condenados al fracaso, no por falta de destreza o inventiva, sino porque las hipótesis adoptadas son insuficientes para decidir la cuestión. En tal caso el problema aparecerá, visto desde la teoría a la que pertenece, como un reto insuperable. Hilbert propone en tal caso recurrir a un procedimiento en el que confía plenamente: probar que las hipótesis admitidas son insuficientes para zanjar la cuestión. En este último caso, la ‘disolución’ del problema se lograría en un segundo nivel, en el que el razonamiento no es acerca de los objetos con los que trata la teoría, sino acerca de la teoría misma.11 Así, de acuerdo con Hilbert, dado un problema matemático siempre es posible (a) resolverlo con los recursos disponibles en la teoría, o (b) demostrar que los axiomas y métodos de prueba admitidos en la teoría no son suficientes para decidir la cuestión, es decir, que todos los intentos por hallar una respuesta al interior del sistema están condenados al fracaso. 8 Hilbert, 1900, p. 1. Ibídem. 10 Al precisar las exigencias que toda buena solución debe satisfacer, Hilbert señala que la más importante es “su exposición metódica y sistemática”. 11 Desde la antigüedad los matemáticos han ofrecido pruebas de imposibilidad. Por ejemplo, la prueba de que la diagonal de un cuadrado es inconmensurable con su lado. No obstante, fue la matemática moderna la que introdujo esta forma de razonamiento en la práctica ordinaria, superando en forma inesperada viejos y difíciles problemas que habían resistido a todos los intentos de solución dentro de la teoría. Por ejemplo, la trisección del ángulo, la rectificación del círculo y la duplicación del cubo con regla y compás; la solución de cualquier ecuación de quinto grado por medio de radicales y la prueba del quinto postulado de Euclides. Todos estos problemas fueron resueltos de manera inesperada: mostrando que con los medios seleccionados no es posible darles solución. 9 Hilbert, 198 4. E L PROGRAMA DE H ILBERT Es importante señalar que para muchos matemáticos esta última posibilidad no representa una solución al problema mismo. Por ejemplo, desde 1963 sabemos que la hipótesis del continuo es independiente de los axiomas de Zermelo-Fraenkel para la teoría de conjuntos, lo cual para muchos matemáticos no resuelve en sí la cuestión acerca de la cardinalidad del conjunto de los números reales. Tal como lo advierte Gödel: “[...] sobre la base del punto de vista aquí admitido, una prueba de la indecidibilidad de la conjetura de Cantor con relación a los axiomas adoptados para la teoría de conjuntos [...] de ninguna manera resuelve el problema.”12 El punto de vista referido es el del realismo conceptual, según el cual “los conceptos y teoremas de la teoría de conjuntos describen una realidad bien determinada, en la que la conjetura de Cantor debe ser falsa o verdadera. Por tanto, su indecidibilidad a partir de los axiomas hoy asumidos sólo puede significar que estos axiomas no contienen una descripción completa de esa realidad.”13 No obstante, para Hilbert, que en estas cuestiones adopta un punto de vista muy cercano al nominalismo, la alternativa recién mencionada (a o b) agota todas las posibilidades: dado un problema matemático, alguna de ellas se habrá de alcanzar, de modo que tarde o temprano se aclarará la relación lógica entre la proposición matemática (‘el problema’) y los principios admitidos. Más allá de esto, diría Hilbert, la matemática no puede ni debe intentar ir: un rotundo ‘no’ al realismo conceptual. Es quizá este importante hecho junto con otras razones filosóficas lo que da lugar a la convicción (compartida por todos los matemáticos, aunque sin el soporte de una prueba) de que todo problema matemático bien definido es susceptible necesariamente de una solución, ya sea en la forma de una respuesta efectiva a la pregunta propuesta, o mediante una prueba de la imposibilidad de su solución, y por lo tanto del irremediable fracaso de todos los intentos. [...] ¿Es el axioma de la resolubilidad de todo problema matemático una característica peculiar del pensamiento matemático, o es acaso una ley general inherente a la naturaleza de la mente, el que toda cuestión que se pregunta debe tener una respuesta?14 Vista desde la matemática, esta convicción, que Hilbert eleva al rango de axioma, parece un factor prevaleciente a lo largo de la historia, y en última instancia la causa de nuestra persistencia al tratar de resolver un problema matemático, en vez de retroceder ante los fracasos. Vehemente, exclama: “La convicción en la resolubilidad de todo problema matemático es un incentivo para el trabajador. Escuchamos dentro de nosotros el canto imperecedero: He ahí un problema. Busca su solución. La podrás encontrar mediante la razón pura, pues en la matemática no hay ignorabimus.”15 Es sobre esta base 12 Gödel, 1964, p. 263. Ibídem. 14 Hilbert, 1900, p. 7. 15 Hilbert, Ibidem. Ignorabimus = ignoraremos. En latín en el original. 13 Gödel, 4.1. L OS INICIOS 199 que Hilbert postula la resolubilidad de todo problema matemático: tarde o temprano cualquier cuestión matemática será resuelta en el sentido recién señalado.16 4.1.2. Una contienda filosófica En la cita anterior Hilbert utiliza la expresión “ignorabimus” en alusión al fisiólogo y filósofo francés Emile DuBois-Reymond (1818-1896), quien al abordar el problema de la existencia de límites en el conocimiento de la naturaleza sostuvo que hay problemas, denominados por él trascendentales, que son irresolubles; éstos incluyen la naturaleza de la materia y la fuerza, y todo lo relacionado con el origen del movimiento, la sensación y la consciencia. Su desalentadora frase “Ignoramus et ignorabimus”–Ignoramos e ignoraremos–, se convirtió en el lema de muchos científicos y filósofos en los años 80 del siglo XIX, y una equivocación desde el punto de vista de Hilbert. En franca oposición, Hilbert no sólo afirma que todo problema matemático se puede resolver, sino que extiende esta creencia a toda la ciencia.17 En su discurso de retiro a los 68 años de edad sostuvo, tal como lo había hecho 30 años atrás, que no existe tal cosa como un problema irresoluble. Sus palabras finales dan testimonio de su irrefrenable optimismo: Alguna vez el filósofo Comte dijo –con el propósito de mencionar un problema ciertamente irresoluble– que la ciencia nunca podría descubrir el secreto de la composición química de los cuerpos celestes. Unos pocos años más tarde este problema fue resuelto mediante el análisis espectral de Bunsen y Kirchhoff [...] La verdadera razón por la cual Comte no pudo hallar un problema irresoluble es, en mi opinión, que no hay en absoluto problemas irresolubles. En lugar del necio ignorabimus, nuestra respuesta es la contraria: Debemos saber, sabremos.18 Como ya lo hemos visto al final de la sección 3.8.1, este credo no fue compartido por Brouwer, quien a la vez que niega la universalidad de principio lógico del tercero 16 En cuanto al axioma de la resolubilidad de todo problema matemático, lo correcto es ubicarlo en un contexto kantiano, tal como lo sugiere Michael Detlefsen en “FOM: Hilbert and solvability, etc.”, http://www.cs.nyu.edu/pipermail/fom/1999-June/003272.html. Kant, al igual que Hilbert, considera que una prueba de la imposibilidad de resolver un problema con los métodos y principios elegidos es también una forma de resolverlo (véase Kant, CRP, A476/B504 y A480/B508). Al respecto, es importante notar que en tal caso la ‘solución’ no se obtiene a través de una prueba al interior de la teoría, sino a través del análisis de las condiciones bajo las cuales se le intenta probar o refutar. En otras palabras, Kant y Hilbert aceptan como ‘solución’ de un problema lo que en filosofía se conoce como una solución trascendental, y en lógica como una prueba de indecidibilidad. Como ya lo hemos señalado, esta postura no es compartida por los defensores del realismo conceptual. 17 Es importante señalar que Hilbert jamás intentó probar esta afirmación más allá de la matemática. No obstante, el solo hecho de mencionarla es un indicativo de la firmeza de sus convicciones. 18 (Hilbert, 1996, p. 1165). Las últimas palabras de la cita, –Debemos saber, sabremos [Wir müssen wissen. Wir werden wissen]– son el epígrafe que se halla sobre la tumba de Hilbert. 200 4. E L PROGRAMA DE H ILBERT excluido, sostiene con firmeza que éste es equivalente a la suposición de que todo problema matemático es resoluble. Finalizamos con dos observaciones: 1. Tal como lo advierte Brouwer (véase la sección 3.8.2), la creencia de Hilbert en la resolubilidad de todo problema matemático no tenía a la sazón (1908) ningún fundamento teórico. Más bien, se trataba de una visión metafísica, de una especulación: en el dominio de la matemática, la razón pura no conoce límites. Esta fe en el poder de la razón sólo es comparable con la de Leibniz y es superior a la de Descartes. Un pensamiento muy en la línea racionalista de la filosofía occidental: los productos de la mente son trasparentes a ella misma, es decir, no hay cuestiones irresolubles en este dominio. 2. Como hemos visto, para Hilbert son dos las maneras de resolver un problema: una, razonando dentro de la teoría; la otra, razonando acerca de la teoría. Por tanto, su creencia se apoya decididamente en la convicción de que la estructura de toda teoría matemática es algo que podemos descubrir, sin dejar nada oculto con relación a su orden lógico-demostrativo.19 En otras palabras: para Hilbert, el camino seguro para resolver un problema matemático fluctúa entre la teoría y la metateoría.20 Una observación final. Hilbert debió postergar la búsqueda de una respuesta a las invectivas de Brouwer hasta la creación de la teoría de la demostración, por lo que la ulterior discusión de este tema no se dio sino hasta la puesta en marcha del así llamado programa de Hilbert. En cuanto a nosotros, la discusión final del tema la daremos tras examinar el efecto que tuvieron los teoremas de Gödel sobre el programa de Hilbert (sección 5.5) y explorar algunos aspectos del debate mentes-máquinas (sección 5.7), sobre todo en lo concerniente a si la mente humana se puede imitar de manera mecánica. 4.2. La naturaleza de la matemática clásica según Hilbert Hilbert dio sus primeros pasos en la teoría de la demostración en una conferencia pronunciada ante la Sociedad Matemática de Copenhague en 1922, bajo el título de “La nueva fundamentación de la matemática”.21 Tras ponderar los esfuerzos realizados por toda una generación de investigadores, admite con molestia que todos esos intentos no finalizaron en una solución satisfactoria del problema de los fundamentos. Reconoce entonces la necesidad de examinar esta cuestión con mayor profundidad, de investigarla 19 Hilbert, 1927, p. 475. única expresión que Hilbert utiliza con el prefijo “meta” es “metamatemática”. No obstante, la palabra “metateoría” se ajusta perfectamente a sus intenciones en este caso. 21 Hilbert 1922. 20 La 4.2. L A NATURALEZA DE LA MATEMÁTICA CLÁSICA SEGÚN H ILBERT 201 desde sus raíces hasta lograr una respuesta precisa, de hallar una respuesta que ya no dé lugar a dudas de principio. En su opinión, el instrumento ideal para lograr esta meta sería la teoría de la demostración, si bien aún faltaba establecer el fundamento teórico de esta última y fijar con precisión los medios de los que se servirá para lograr su objetivo. Fueron estos dos últimos propósitos los que lo llevaron a tratar de esclarecer la naturaleza de la matemática clásica, a reconsiderar la filosofía crítica de Kant y a especular en torno al conocimiento matemático y los métodos admisibles en esta ciencia. Esto lo hizo a lo largo de los siguientes años en los que hubo de desarrollar una intensa actividad en tales dominios.22 Volviendo a la conferencia de 1922, Hilbert emprende la discusión de los fundamentos impugnando la propuesta de Brouwer y Weyl. A fin de cuentas él se había equivocado: los argumentos de Brouwer, que a nadie convencerían, convencieron a Weyl ¡Esto era más de lo que podía tolerar, un hecho inaceptable! ¿Cómo él, caudillo de la matemática alemana, habría de permitir que el adversario irrumpiera en su casa y por la puerta del frente? Era indispensable frenar el avance de esa tendencia, resolver en definitiva el problema de los fundamentos, disipar las dudas que se pudieran tener respecto a la matemática clásica y la lógica aristotélica, que en connivencia se habían extendido más allá de la argumentación constructiva. Dice al respecto: Lo que Weyl y Brouwer pretenden hacer equivale en principio a recorrer el camino que alguna vez siguiera Kronecker. Es decir, Weyl y Brouwer intentan ofrecer una fundamentación de las matemáticas que echa por la borda todo aquello que les incomoda, estableciendo (en el sentido de su predecesor) una serie de prohibiciones claramente dictatoriales. Pero esto no significa otra cosa que el desmembramiento, la amputación arbitraria de nuestra disciplina. Al seguir a tales reformadores nos exponemos a perder una gran parte de nuestros más valiosos conceptos, resultados y métodos.23 Para Hilbert el problema de los fundamentos se ha de resolver de otra manera. Si bien acepta que el poder del pensamiento intuitivo no llega más allá de lo que sostienen Kronecker y Brouwer, y reconoce que ninguna proposición transfinita de la matemática se puede justificar como verdad material evidente, eso no es una razón para renunciar a las conquistas de una matemática que con mucho ha desbordado dicha esfera.24 Más bien, lo procedente es examinar los métodos y conceptos con que se ha enriquecido la matemática y resguardarlos de cualquier peligro. Había, sobre todo, que proteger los 22 Los trabajos correspondientes a esta labor incluyen a Hilbert 1922a, 1925, 1927, 1928, 1930 y 1930a. 23 Hilbert, 1922. Cita tomada de la traducción al español, p. 40. las palabras con que Hilbert reconvino a Brouwer tras una charla que éste diera en el Instituto de Matemáticas de Gotinga, ya citadas en esta obra: “Con sus métodos, la mayor parte de los resultados de la matemática moderna tendrían que ser abandonados, y para mí la cosa más importante no es obtener menos resultados, sino más de ellos.” (Reid, 1970, p. 184). 24 Recordemos 202 4. E L PROGRAMA DE H ILBERT resultados ya alcanzados, otorgando a los principios puestos en duda (v. gr., el axioma de elección) la misma certidumbre que tiene una afirmación como que 2 + 2 = 4; especialmente, había que aclarar la naturaleza del infinito, blanco favorito de todos los ataques.25 Todo esto requería llevar la investigación de los fundamentos hasta un punto jamás alcanzado. 4.2.1. La naturaleza, el entendimiento y el infinito Al intentar esclarecer la noción de infinito hay cuestiones que no se pueden soslayar: ¿qué lugar ocupa el infinito en nuestro pensamiento, en el conocimiento de la naturaleza, en la matemática?, ¿tiene éste algún significado empírico, corresponde a alguna realidad? En un trabajo dedicado específicamente a este problema Hilbert fija su posición.26 En su opinión, se trata de una noción ideal en el sentido kantiano, es decir, de una idea a la que nada corresponde en la experiencia ni le podemos adjudicar validez objetiva. Para empezar Hilbert se pregunta por el lugar que el infinito ocupa en la naturaleza. Explica que al examinarla nos podemos percatar de que la noción de infinito —-en cualquiera de sus sentidos– no posee ningún significado, aun cuando la impresión que nos causan a primera vista los eventos naturales y el mundo material es que son uniformes y continuos. Afirma, por ejemplo, que una pieza de metal o un volumen de líquido nos dan la impresión de ser divisibles de un modo ilimitado, de que cualquiera de sus partes, no importa lo pequeña que sea, tendrá nuevamente las mismas propiedades. Sin embargo, una vez que los métodos de investigación de la física se perfeccionaron lo suficiente, se encontraron límites a la divisibilidad de la materia, limites ligados indisolublemente a su naturaleza y no a la de los experimentos. La ciencia moderna, según Hilbert, nos ha liberado con ello de lo infinitamente pequeño. La divisibilidad infinita del continuo es una operación presente tan sólo en el pensamiento; una idea que es refutada por nuestra observación de la naturaleza.27 25 La reacción de Hilbert es en contra de quienes, como Brouwer, se oponen al uso del infinito actual en la matemática, y en contra de quienes pretenden limitar el uso de las habituales leyes de la lógica. Para él era inadmisible renunciar a ello, como lo debería ser para quienquiera que se sirve del análisis matemático, donde, a pesar del abundante uso de los métodos puestos en duda, es posible encontrar plena certeza en sus deducciones y una evidente concordancia entre sus resultados. Esto era un indicativo de que el problema no tenía como causa el uso del infinito actual en la matemática, sino el descuido en su manejo. 26 Hilbert, 1925. 27 Veamos cómo se expresa Robert Frisch (físico austriaco) en una entrevista que le hiciera Pierre Kister: “Kister. ¿Qué es una partícula elemental? Frisch. Me gustaría saberlo. La materia se compone de átomos; los átomos, de electrones y núcleos; los núcleos tienen protones y neutrones. ¿Continuará el juego de encontrar partes más pequeñas de materia, y durante cuánto tiempo? Ciertamente las reglas del juego cambian. Se ha propuesto que el protón consta de tres subunidades (quarcs) cada una de ellas de masa mucho mayor que la del protón. Esto, absurdo a primera vista, es posible debido a la ecuación E = mc2 ; al combinar los tres quarcs, se irradia la mayor parte de su masa en forma de energía. Por tanto, puede suceder que la búsqueda de partículas elementales no conduzca a masas más y más pequeñas, 4.2. L A NATURALEZA DE LA MATEMÁTICA CLÁSICA SEGÚN H ILBERT 203 Hilbert refuerza su argumento señalando otro problema al que tuvo que enfrentarse la ciencia moderna: el de la infinitud del espacio físico. Durante mucho tiempo fue dominante la idea de que el espacio físico era infinito. Se consideraba que la geometría euclidiana era necesariamente verdadera con relación al espacio, y dicha geometría conduce directamente a la conclusión de que éste es infinito. Sin embargo, aduce que si bien la geometría euclidiana es consistente, de ello no se sigue que ésta sea aplicable a la realidad (eso ya lo hemos analizado en el capítulo 1). Es más, es perfectamente posible que otra geometría, distinta a la euclidiana, nos proporcione un modelo finito de la misma. Éste es el caso de la geometría elíptica o de Riemann, la cual ha desplazado a la euclidiana como modelo del espacio físico y esto no sólo por consideraciones de carácter enteramente matemático o filosófico, sino por otra clase de argumentos que en principio nada tienen que ver con estas disciplinas. Este desplazamiento tuvo lugar cuando Einstein probó la necesidad de abandonar la geometría euclidiana a partir de la teoría de la relatividad. Al desarrollar su teoría de la gravitación, Einstein atacó los problemas cosmológicos mostrando la posibilidad de un universo finito. Hilbert señala que a la fecha (1925) todos los resultados obtenidos por los astrónomos son compatibles con la idea de un universo finito. De este modo, los resultados que arroja la física indican que, en ambos sentidos, el mundo físico posee límites, es finito. No obstante, aunque el infinito no corresponda a nada en la naturaleza, Hilbert no ve en ello una razón para excluirlo de nuestra urdimbre intelectual, en donde desempeña, desde su punto de vista, un papel fundamental: “Podría ocurrir, no obstante, que el lugar propio y justificado del infinito no sea la realidad, sino nuestro pensamiento. Y podría muy bien resultar que en éste el infinito asuma una función conceptual absolutamente imprescindible.”28 En otras palabras, si bien el concepto de infinito no corresponde a ninguna realidad física, Hilbert ve en él un instrumento esencial de la razón: “El papel que resta al infinito es el de una idea, según la concepción kantiana de ésta, como un concepto de razón que supera toda experiencia y por medio de la cual se complementa lo concreto en el sentido de una totalidad.”29 como en el pasado.” (Cita tomada de Pajares, 1973, p. 78). Esta idea de que la materia presenta límites a la posibilidad de dividirla sigue vigente en nuestros días, en la que ninguna teoría se basa en la hipótesis de que la materia es infinitamente divisible. Véase al respecto todo lo relativo al bosón de Higgs. 28 Hilbert, 1925. Cita tomada de la traducción al español, pp. 87-88. Es en este texto (p. 94) donde Hilbert se declara acérrimo defensor de la matemática transfinita con las siguientes palabras, ahora famosas, y que ya hemos citado: “Nadie podrá expulsarnos del paraíso que Cantor ha creado para nosotros”. 29 Hilbert, op. cit., p. 121. Respecto a la existencia del infinito, Hilbert se arroga las mismas reservas que Kant cuando, en una conocida nota de la Crítica de la Razón pura, dice: “El conocimiento de un objeto implica el poder demostrar su posibilidad, sea porque la experiencia testimonie su realidad, sea a priori, mediante la razón. Puedo, en cambio, pensar lo que quiera, siempre que no me contradiga, es decir, siempre que mi concepto sea un pensamiento posible, aunque no pueda responder de si, en el conjunto de todas las posibilidades, le corresponde o no un objeto. Para conferir validez objetiva (posibilidad real, pues la anterior es simplemente lógica) a este concepto, se requiere algo más.” [Kant, CRP, B XXVII, nota k.] En este sentido, Hilbert no pretende probar la existencia real del infinito, sino legitimarlo como un objeto del pensamiento mediante una prueba de consistencia. Como pronto veremos, Hilbert habría de exigir algo más a la incorporación de esta y otras nociones ideales a la teoría: que no condujeran a 204 4. E L PROGRAMA DE H ILBERT Pero, ¿de qué medios se vale el infinito para complementar lo concreto? Lo hace a través de la matemática, único dominio en el que se puede hacer un uso no especulativo de esta noción. Dice Hilbert: “El instrumento que media entre la teoría y la práctica, entre el pensamiento y la observación, es la matemática; ella construye los puentes que los une y los hace aun más sólidos. Sucede así que toda nuestra cultura moderna, en la medida en que se apoya en la penetración y utilización de la naturaleza, tiene su fundamento en la matemática.”30 , a lo que más adelante añade: “Sin la matemática, la astronomía y la física modernas no serían posibles; estas ciencias, en sus partes teóricas, casi se disuelven en la matemática. Es a éstas y a muchas otras aplicaciones que la matemática debe el prestigio que tiene entre el público en general.”31 4.2.2. El infinito en la matemática Las anteriores reflexiones de Hilbert en torno al infinito se hallan en la conferencia ya citada que ofreciera ante la Sociedad Matemática de Westfalia bajo el título de “Acerca del infinito”.32 El trabajo inicia con una apología de la obra de Karl Weierstrass, quien dedicara buena parte de su obra a la fundamentación del análisis matemático. Al respecto, Hilbert afirma que fue Weierstrass quien dio una base definitiva a esta disciplina al definir de manera precisa nociones como las de mínimo, función, límite y derivada, las cuales permitieron construir la teoría sin hacer referencia al infinito actual, en el sentido de lo infinitamente grande o lo infinitamente pequeño.33 No obstante, señala Hilbert, a pesar de tales esfuerzos la matemática clásica no pudo excluir toda alusión al infinito, ya que esta noción reapareció de manera esencial bajo la modalidad del infinito actual. “Debido a esta circunstancia, el infinito se pudo deslizar de manera disimulada en la teoría de Weierstrass sin ser afectado en lo esencial por su crítica.”34 En efecto, el infinito actual se hizo presente en el análisis matemático a través de las cortaduras de Dedekind, conjuntos infinitos de números racionales concebidos como totalidades cerradas y acabadas. Esta noción también se presenta al considerar ciertos conjuntos –v. gr., todas las funciones continuas o todos los números reales– como totalidades completas y terminadas. Hilbert resalta la presencia de esta noción en el análisis con las siguientes palabras: “En cierto sentido, el análisis matemático no es sino una sinfonía del infinito.”35 Convertida la noción en una pieza fundamental de resultados que no se pudieran comprobar en lo que llamaría matemática finitista, tema que trataremos más adelante. 30 Hilbert, 1930. Cita tomada de la traducción al inglés, p. 1163. 31 Hilbert, op. cit., p. 1164. 32 El texto de la conferencia se publicó en 1926, y en la bibliografía corresponde a Hilbert, 1925. 33 Por ejemplo, cuando escribimos lı́m 1 = ∞, la alusión que hacemos al infinito es sólo una “forma de x x→0 hablar”, queriendo decir con ella que el valor del cociente crece ilimitadamente a medida en que x toma valores cada vez más cercanos a 0. 34 Hilbert, 1925. Cita tomada de la traducción al español, p. 84. 35 Hilbert, op. cit., p. 89. Adoptando un punto de vista todavía más general, Hermann Weyl destaca la importancia de esta noción en la matemática moderna con las siguientes palabras, aún más elocuentes: 4.2. L A NATURALEZA DE LA MATEMÁTICA CLÁSICA SEGÚN H ILBERT 205 la matemática moderna, lo conducente era clarificar su uso a fin de disipar las dudas suscitadas por las paradojas, aunque la empresa iba “mucho más allá del ámbito de los intereses científicos particulares, [siendo] algo que, en realidad, se ha convertido en una cuestión de honor para el entendimiento humano.”36 Al respecto, juzga que la visión más penetrante que se ha logrado de la naturaleza del infinito es la de Cantor, cuya teoría se acerca más a una forma filosófica de pensar que a la matemática misma. “En mi opinión, el sistema de Cantor constituye no sólo la flor más admirable que el espíritu matemático ha producido, sino igualmente uno de los logros más elevados de la actividad intelectual humana en general.”37 Decantar esta noción es un deber que rebasa la esfera de la matemática, pues atañe a nuestra concepción de la naturaleza y a la reflexión filosófica por igual: “Como ningún otro problema, el del infinito ha inquietado desde los tiempos más remotos el ánimo de los hombres. Ninguna otra idea ha sido tan estimulante y fructífera para el entendimiento. Pero, como ningún otro concepto, requiere de precisión y esclarecimiento satisfactorios.”38 No pretendemos repetir los argumentos de Hilbert en defensa del infinito actual de la teoría cantoriana, ni abundar en su carácter ideal. En vez de ello, habremos de precisar la manera en que ésta y otras nociones ideales se enlazan con una matemática que se ocupa de objetos y propiedades de objetos concretos, y cuya fuente la encuentra Hilbert no en una actividad introspectiva como Brouwer, sino en ciertas formas de nuestra intuición sensible. 4.2.3. La matemática clásica Según Hilbert, la matemática clásica comprende dos tipos de nociones: descriptivas e ideales. Grosso modo, las nociones descriptivas corresponden a objetos y construcciones concretas en la esfera de la sensibilidad. Por el contrario, las nociones ideales son ideas de razón que trascienden el ámbito de la sensibilidad e incluso de toda experiencia; su función es completar las teorías matemáticas. Entre las nociones ideales no sólo se encuentra el infinito actual, sino ciertos principios lógicos que no se pueden justificar con base en consideraciones intuitivas. Por ejemplo, el principio del tercero excluido.39 Tales principios hacen las veces de enunciados ideales que, sin ser susceptibles de una verificación directa, complementan el aparato demostrativo a fin de preservar las leyes de la lógica aristotélica. Para entender mejor estas ideas conviene atender la exposición “Si al resumir se necesita una frase breve que describa el centro vital de las matemáticas, uno bien puede decir: matemáticas es la ciencia del infinito.” [Weyl, 1949. Cita tomada de la traducción al español, p. 73]. 36 Hilbert, op. cit., p. 85. 37 Hilbert, op. cit., p. 90. 38 Hilbert, op. cit., p. 85. 39 Como ya lo hemos visto, dado un dominio infinito X y una propiedad P aplicable a sus elementos, la aceptación incondicional del principio del tercero excluido consiste en asumir que o bien la propiedad P se cumple para todos los elementos de X, o bien existe un objeto en X para el que no se cumple P, aunque no se cuente con los medios para inclinarse en favor de alguno de los términos de esta alternativa. Al respecto véanse las consideraciones hechas en la sección 3.8.1. 206 4. E L PROGRAMA DE H ILBERT que hace Hilbert de la teoría elemental de los números, “la criatura más pura e ingenua del espíritu humano.”40 Dicha exposición permite delimitar en parte el alcance de los métodos matemáticos que él llama finitistas, y entender a qué se refiere Hilbert cuando habla de una matemática que trata con objetos y propiedades de objetos concretos. La teoría elemental de los números. Consideremos una fórmula numérica cualquiera, como, por ejemplo, la igualdad n ∑i = 1+2+3+...+n = 1 n(n + 1) 2 (4.1) En ella, la variable n se puede reemplazar por un número natural cualquiera como, por ejemplo, 7 ó 586, por lo que en realidad la fórmula contiene una infinidad de enunciados. “Esto es precisamente lo esencial de la misma, y es gracias a ello que puede representar la solución de un problema numérico [en este caso, el de encontrar una expresión para la suma de los primeros n números naturales] y requerir de un genuino argumento aritmético para su prueba.”41 Por contraste, toda ecuación numérica particular como 1+2+3+...+7 = 7·8 2 ó 1 + 2 + . . . + 586 = 586 · 587 2 se puede verificar directamente llevando a cabo las operaciones indicadas, por lo que ninguna de ellas tiene, por sí misma, un interés especial. En otras palabras: la verdadera riqueza de la teoría aritmética radica, no en sus enunciados de carácter particular, sino en aquellos de carácter general de los que los primeros se obtienen como casos específicos, y en la posibilidad de establecer vínculos deductivos entre todos ellos (a esto es a lo que se refiere Hilbert cuando habla de un “genuino argumento aritmético.”42 ) Tenemos, por tanto, una primera división de los enunciados de la teoría aritmética en dos clases: por un lado, los que se pueden verificar directamente (v. gr., igualdades y desigualdades numéricas) y por el otro, enunciados de carácter general que sólo se pueden establecer mediante una prueba. Esto nos lleva a dos problemas: al del significado de los enunciados aritméticos y al de los métodos de prueba admisibles. 40 Hilbert, op. cit., p. 88. ibid. 42 Por ejemplo, de la fórmula (4.1) se sigue que n + 2n + 3n + . . . + n2 = 1 (n3 + n2 ), otro enunciado de 2 carácter general. El argumento se basa en el hecho de que n + 2n + 3n + . . . + n2 = n(1 + 2 + 3 + . . . + n). En este caso el “genuino argumento aritmético” mediante el cual se establece la segunda igualdad consiste en un cálculo algebraico que lleva de la primera identidad a la segunda. 41 Hilbert, 4.2. L A NATURALEZA DE LA MATEMÁTICA CLÁSICA SEGÚN H ILBERT 207 ¿Sobre qué base se establece el saber aritmético? No nos referimos a la teoría axiomática de Peano que, como hemos visto, no es sino la ordenación de diversos hechos aritméticos que le son previos. Nos referimos más bien a la formación de la teoría aritmética: ¿de qué trata?, ¿a qué clase de objetos se refiere?, ¿bajo qué circunstancias decimos que sus enunciados son verdaderos? Para Hilbert, esta teoría tiene un objeto de estudio que se puede representar en el ámbito de la sensibilidad. Se trata de los numerales | || ||| |||| ||||| ··· los cuales se caracterizan por el hecho de que a cada trazo | siempre le sigue, si acaso, otro trazo igual. Estos numerales carecen de significado, pero podemos formar enunciados significativos acerca de ellos con la ayuda de otros signos, que sirven como abreviaturas (por ejemplo, el signo 2 como abreviatura de ||, el signo 3 como abreviatura de |||, etc.) o para comunicar información (como, por ejemplo, los signos <, =, +, etc.). Así, por ejemplo, un enunciado como “7 + 5 = 12” es una comunicación que nos dice que 7 + 5 y 12 son (tomando en cuenta las abreviaturas utilizadas) el mismo numeral.43 Estos signos adicionales incluyen letras como m, n, p, k, etc. para representar numerales cualesquiera. Llamemos números a estos objetos (es decir, a los numerales). En esta teoría es posible llegar a resultados de alcance general. Por ejemplo, con base en inferencias materiales que comprenden a la manipulación de trazos y un argumento de carácter inductivo se pueden demostrar enunciados como n+m = m+n que expresa la igualdad entre dos numerales en su forma general. El argumento requerido para ello no es de carácter hipotético, sino que se basa en consideraciones 43 Las convenciones son más o menos obvias: a = b significa que los numerales a y b tienen la misma longitud o cantidad de trazos, es decir, que al eliminar simultáneamente un trazo de cada uno de ellos una y otra vez, se agotan al mismo tiempo. En cambio, si al agotarse los trazos de uno de los numerales, digamos a, aún quedan algunos trazos de b, entonces escribimos a < b. A su vez, a + b denota el numeral que resulta de concatenar los numerales a y b, y a · b es el numeral que resulta de sustituir cada uno de los trazos de a con la figura b (es decir, por el numeral denotado con b). Por ejemplo, el numeral 2 · 3 es el numeral 6, que se obtiene así: || ||| ||| = |||||| Nótese que por el modo en que se construye la teoría, un enunciado como “7 + 5 = 12” es sintético a priori, pues la construcción tiene lugar en la intuición pura y es independiente de la experiencia. Hilbert no elimina el apriorismo kantiano, sino que lo sitúa en la más reducida esfera del Anschauung. 208 4. E L PROGRAMA DE H ILBERT estrictamente constructivas. Hilbert y Bernays se refieren a este tipo de razonamientos como inferencias finitistas [das finite Schließen].44 “Utilizaremos la palabra “finitista” para indicar que la discusión, afirmación o definición en curso se mantiene dentro de los límites de la plena realización de los objetos y que, en conformidad, se puede llevar a cabo dentro del dominio de la inspección concreta.”45 Todas las definiciones que hemos visto con relación a los numerales son finitistas y podemos dar una interpretación finitista de los dos procedimientos aritméticos de prueba y definición más importantes: nos referimos a las definiciones por recursión y a las pruebas por inducción matemática. Inducción. Una prueba por inducción de un teorema A(n) debe proporcionar los medios para verificar A(n) para cualquier numeral n en un número finito de pasos, número que se puede acotar de antemano. Recursión. Una definición recursiva de una función f (n) debe indicar cómo evaluar f (n) para cualquier numeral n en un número finito de pasos previamente acotado.46 Con estos procedimientos a la mano es posible expresar en términos finitistas los argumentos usuales con los que se establecen las leyes conmutativa, asociativa y distributiva de la suma y la multiplicación, introducir las nociones de divisor y número primo, y demostrar el teorema fundamental de la aritmética, según el cual todo número entero es representable de una y sólo una manera como un producto de factores primos.47 El transfinito. Algo esencial al razonamiento finitista es que los objetos considerados sean producibles, al menos en principio, en el ámbito de la percepción, y que no admite ningún procedimiento de definición o de cálculo a menos que éste termine en un número finito de pasos y se pueda fijar de antemano una cota a tal número.48 Obviamente, estas limitaciones se convierten en una pesada carga cuando se adopta el punto de vista finitista con relación a proposiciones que contienen cuantificadores. Por ejemplo, un enunciado ∀nA(n) se debe entender como significando que, para cada numeral n, se puede demostrar finitariamente que la proposición A(n) es verdadera; a su vez, un enunciado ∃nA(n) sólo se puede declarar cuando se conoce un numeral n para el que A(n) es verdadero o al menos se cuenta con un procedimiento efectivo para calcular tal numeral en un número predeterminado de pasos. 44 Hilbert y Bernays, 1934, p. 32. y Bernays, ibid. Más adelante intentaremos una caracterización más precisa de esta clase de argumentos. 46 Para un comentario más extenso sobre la inducción matemática y las definiciones por recursión, véase el apéndice J. 47 Este teorema es fundamental en la demostración de los teoremas de incompletud de Gödel, y el hecho de que pertenezca a la aritmética recursiva lo ha convertido en un instrumento esencial de la teoría de la representación. 48 En otras palabras, los objetos de la matemática finitista se construyen, no se postulan, y su construc√ ción no es parcial. Por ejemplo, 2 no es un objeto de esta índole, aunque se cuenta con una regla para aproximarlo tanto como se desee. Por el contrario, en la matemática clásica lo que se hace es tomar la sucesión (infinita) de aproximaciones como el número mismo (su cortadura). 45 Hilbert 4.2. L A NATURALEZA DE LA MATEMÁTICA CLÁSICA SEGÚN H ILBERT 209 Por ejemplo, la afirmación de que hay una infinidad de números primos no es finitista. Este teorema lo podemos expresar así (donde p(n) significa “n es primo”): ∀m∃n(p(n) ∧ m < n) (4.2) En el libro IX de los Elementos, Euclides establece este teorema en una forma más precisa, y siguiendo un procedimiento que marcha acorde con el punto de vista finitista. Lo que él demuestra es que si p es un número primo, entonces entre p + 1 y p! + 1 existe al menos otro número primo (de donde se sigue la infinitud del conjunto formado por tales números).49 Nótese que el teorema que demuestra Euclides [proposición IX.20] dice algo más que (4.2), pues señala el rango donde se halla el siguiente número primo. En tal caso la fórmula (4.2) se puede sustituir por ∀m∃n(p(n) ∧ m < n ≤ m! + 1) (4.3) Nótese que en este caso el enunciado ∃n(p(n) ∧ m < n ≤ m! + 1) puede sustituirse con p(m + 1) ∨ p(m + 2) ∨ . . . ∨ p(m! + 1) de corte finitista. Con relación a (4.3), el más impreciso enunciado (4.2) representa un salto al transfinito. En efecto, si quisiéramos eliminar el cuantificador existencial en (4.2), lo que obtendríamos sería un seudoenunciado infinito p(m + 1) ∨ p(m + 2) ∨ . . . ∨ p(m! + 1) ∨ p(m! + 2) ∨ . . . con una infinidad de términos y sin interpretación finitista. Hay que tener claro que un enunciado como ∃n(p(n) ∧ m < n) no se puede interpretar como una expresión compuesta por una infinidad de aseveraciones enlazadas por la conectiva “∨” (la palabra “o”).50 Más bien, lo correcto es interpretarlo como un enunciado hipotético que afirma algo toda vez que ya tengamos un numeral (es decir, toda vez que conozcamos un número primo mayor que m). De hecho, los enunciados que denominamos puramente existenciales, en los que se afirma la existencia de un objeto dentro de una infinidad de posibilidades y sin saber cuál es, son enunciados ideales. Tienen la característica de que 49 En general, n! denota al número que resulta de multiplicar entre sí todos los números positivos menores o iguales que n: n! = 1 · 2 · 3 · . . . · (n − 1) · n 50 Es decir, nos topamos con el transfinito cuando tratamos con enunciados existenciales que no corresponden a una disyunción finita, al igual que lo hacemos con los enunciados universales que no corresponden a una conjunción finita. Un ejemplo de ello es el siguiente enunciado: Si a y b son primos relativos entre sí, entonces existe un número natural n tal que an + b es un número primo. 210 4. E L PROGRAMA DE H ILBERT no comunican de manera inmediata ningún contenido y por lo general se demuestran por reducción al absurdo.51 Métodos finitistas y no finitistas. Como consecuencia de todo lo anterior tenemos que, desde la perspectiva finitista, no es lícito utilizar indiscriminadamente el principio del tercero excluido, según el cual o bien hay un número primo mayor que m o no lo hay. De la misma manera, la interpretación finitista de ciertos enunciados no elementales que contienen negaciones es muy complicada,52 llegándose a extremos tan alarmantes como la imposibilidad de negar enunciados tan simples como ∀m∀n(m + n = n + m). Someterse a tales limitaciones tendría terribles consecuencias para la teoría aritmética. Por ejemplo, un teorema tan simple como el Postulado de Bertrand 53 Para todo número n, existe un número primo p tal que n < p ≤ 2n no tendría cabida en ella, pues las únicas pruebas conocidas son por reducción al absurdo,54 y este tipo de argumentos sobrepasan el tratamiento intuitivo y concreto de los numerales. En palabras de Hilbert: Podemos concluir entonces que cuando permanecemos, tal y como estamos obligados a hacerlo, en la esfera de los enunciados finitos, dependemos de relaciones poco claras, y esta ausencia de claridad se convierte en algo intolerable cuando el “todos” y el “existe” se combinan en enunciados subordinados. Como sea, las leyes lógicas utilizadas por el ser humano desde que éste tiene la capacidad de pensar y que Aristóteles nos ha enseñado no tienen aquí validez. Así las cosas, podríamos proponernos como tarea inicial la determinación explícita de las leyes lógicas que son válidas para la esfera de las proposiciones finitarias. Sin embargo, esto no bastaría, pues, en realidad, lo que no 51 A este tipo corresponden el axioma del supremo y el teorema del valor medio. El primero afirma que todo conjunto de números reales no vacío y acotado superiormente tiene una mínima cota superior. El segundo asevera que si f : [a, b] → R es una función continua en [a, b] y diferenciable en (a, b), entonces existe un número c en este último intervalo con la propiedad de que f (c) = f (b) − f (a) . b−a Un ejemplo de esta clase de enunciados en la teoría de números es el siguiente: Si a y b son dos números primos relativos entre sí, entonces existe un número n tal que an + b es primo. 52 Por enunciado elemental entendemos cualquier enunciado que no contiene ni variables ni cuantificadores, y que sólo trata de igualdades y desigualdades numéricas. 53 Agradezco al Dr. José Antonio Robles el siguiente comentario. Ante mi desconcierto sobre por qué a este teorema se le llama postulado, El Dr. Robles me explicó que en 1845 Joseph L. F. Bertrand (1822-1900) formuló este enunciado sin demostración, llamándosele quizá por ello “postulado”, y que fue P. L. Tchebychef (1821-1894) quien finalmente lo demostró en 1850. Como referencia me dio la siguiente: (Boyer 1968, p. 551). 54 Es decir, mediante un argumento de la forma: “supongamos que hay un número n para el que no se cumple esta propiedad” a partir de lo cual se deduce una contradicción. (v. la sección 3.8.1). 4.2. L A NATURALEZA DE LA MATEMÁTICA CLÁSICA SEGÚN H ILBERT 211 queremos es renunciar al uso de las sencillas leyes de la lógica aristotélica, y nadie, no importa qué tan persuasivamente argumente, podrá impedir que los hombres continúen negando afirmaciones de todo tipo, haciendo juicios parciales y aplicando el principio del tercero excluido. Pero entonces, ¿cuál será nuestra actitud?55 La respuesta la encuentra en la matemática misma, donde ya se han presentado situaciones igualmente difíciles con anterioridad. Exclama: “ha sido el genial método de los elementos ideales el que en tales circunstancias nos ha salvado.”56 Hilbert se refiere a la incorporación de “objetos” como los puntos al infinito en geometría o el √ número i = −1 en el álgebra, que sin corresponder a nada en la “realidad” estudiada, permitieron simplificar las leyes al dar uniformidad a su tratamiento.57 En la matemática clásica se hacen presentes dos tipos de elementos ideales: por una parte, ciertos enunciados cuya función es conservar las reglas de la lógica aristotélica en su simplicidad original; por la otra, ciertas nociones imaginarias (v. gr., la de infinito actual) que permiten introducir principios demostrativos como el axioma de elección. Al respecto dice lo siguiente: Para estar seguros, el método de los elementos ideales está sujeto a una sola condición que le es indispensable, y ésta es la prueba de consistencia; pues la extensión [de una teoría] mediante la adición de elementos ideales es legítima sólo si en el viejo y más estrecho dominio no se introduce ninguna contradicción, esto es, si las relaciones que resultan para los viejos objetos cuando se eliminan los objetos ideales son válidas en el viejo dominio.58 Como veremos, la manera en que Hilbert pretende probar la consistencia de la teoría que resulta al extender la matemática finitista mediante nociones ideales es sumamente ingeniosa y tiene como base la estricta formalización de la teoría.59 Para finalizar, algunos comentarios. 55 Hilbert, 1925. Cita tomada de la traducción al español, pp. 99-100. ibid. 57 En las secciones 1.7.1 y 1.7.2 ya hemos tocado estas cuestiones. Como complemento, el lector haría bien el leer en apéndice K, donde hallará un extenso comentario acerca de estas nociones. 58 Hilbert, 1928. Cita tomada de la traducción al inglés, p. 471. 59 Creemos que para Hilbert la matemática es, en última instancia, una actividad humana que reviste cierto gozo, y si hubiera que pasar por todas las limitaciones que Brouwer impone, muy pocos querrían ser matemáticos. Junto a esto considera que mientras no se exhiba una contradicción en la matemática clásica, pocos estarán dispuestos a abandonar las leyes usuales de la lógica, que con elegancia y economía de pensamiento permiten un rápido avance. Obviamente, proceder de esta manera implica desbordar el cauce de la matemática finitista, cuyos métodos operan como una camisa de fuerza. Frente a este dilema Hilbert se impone una tarea: la de conciliar los métodos y conceptos de la matemática finitista con los métodos y las nociones ideales de la matemática transfinita mediante una prueba de consistencia. Al respecto, véase el tercer comentario al final de esta sección y el siguiente apartado. 56 Hilbert, 212 4. E L PROGRAMA DE H ILBERT 1. Hilbert jamás explicó con exactitud lo que es la matemática finitista. No obstante, por lo que dice en sus escritos debemos entender que se trata de una teoría de naturaleza puramente combinatoria, que trabaja con configuraciones de objetos finitos y discretos que se pueden representar de manera concreta, e inspeccionar en todas sus partes. En este sentido, la aritmética que aprendemos en la escuela primaria se puede considerar como típicamente finitista: trata de los números naturales y ciertas operaciones específicas con ellos (v. gr., la suma y la multiplicación) y tiene un carácter enteramente combinatorio. Por ejemplo, aprender a “sumar” consiste en asimilar, en el contexto del sistema decimal, ciertas reglas combinatorias y ciertos algoritmos que permiten obtener la representación decimal de “la suma” de dos números a partir de la representación decimal de estos últimos. 2. En 1958, Gödel precisó las características que debería tener una noción para no ser finitista, delimitando de este modo el alcance de la matemática finitista. Dice que por nociones abstractas (o no intuitivas) debemos entender nociones que son esencialmente de segundo orden o de orden superior, es decir, que no encierran propiedades o relaciones de objetos concretos (por ejemplo, combinaciones de signos), sino que se relacionan con construcciones mentales (por ejemplo, demostraciones, enunciados significativos, etc.). De la misma manera, una demostración es no finitista cuando en ella hacemos uso de discernimientos que resultan, no de las propiedades combinatorias (espacio-temporales) de combinaciones de signos, sino sólo de su significado (v. Gödel, 1958). Si bien no se tiene una definición rigurosa de la misma, es claro que la matemática finitista sólo trata con objetos eventualmente perceptibles. Se trata de un dominio en el que la evidencia descansa en la intuición sensible y las demostraciones se apoyan en exclusiva en la consideración de objetos concretos (combinaciones de signos, por ejemplo) y sus relaciones mutuas. Por esta razón en la matemática finitista no se acepta ningún tipo de evidencia abstracta como, por ejemplo, la relacionada con las demostraciones de existencia por reducción al absurdo o con la noción de construcción mental. En otras palabras, las pruebas consideradas en este dominio sólo hacen referencia a las propiedades (espacio-temporales) de las combinaciones de signos consideradas y su único punto de apoyo es la intuición del signo. En el capítulo 5 volveremos a este tema, una vez que hayamos introducido el concepto de predicado recursivo, con cuya ayuda podremos aproximar la noción de enunciado finitista con mayor exactitud. 3. Como sabemos, Hilbert pretende conciliar las nociones descriptivas de la matemática clásica con las leyes de la lógica aristotélica y las nociones transfinitas de Cantor mediante una prueba de consistencia. Tal como lo señala Stephan Körner,60 esta idea es de extracción kantiana, y si bien Hilbert no hace ninguna 60 Cf. Körner, 1960, cuarto capítulo. 4.2. L A NATURALEZA DE LA MATEMÁTICA CLÁSICA SEGÚN H ILBERT 213 referencia a Kant en lo tocante a esta cuestión, el principio del que parte para la reconciliación –probar su consistencia– ya se encuentra en la Crítica de la razón pura. Por ejemplo, en la tercera antinomia de la razón pura Kant aborda el conflicto entre la libertad y la ley natural. Por libertad, Kant entiende la independencia de toda causalidad, la autodeterminación; en cambio, por ley natural entiende el principio según el cual todo cuanto sucede posee una causa: dos ideas en oposición aparente. Este problema reviste cierta importancia. Por una parte, Kant debe dar cuenta de la libre voluntad del hombre, cuyos actos aparecen como resultado de una autolegislación (la ley moral) que se halla por encima de las leyes naturales; por la otra parte, Kant debe respetar la física de Newton, fundada en la noción de causa: dos ideas en aparente conflicto. La propuesta de Kant consiste en afirmar que la noción de libertad es una idea pura, trascendental, que no contiene nada proveniente de la experiencia y que no puede aplicarse a ella.61 Por el contrario, la física de Newton es un sistema integrado por nociones aplicables primordialmente a objetos concretos. Según Kant, este sistema se puede ampliar mediante nociones ideales siempre y cuando la extensión se haga de manera coherente, es decir, a condición de que las nociones con que se amplía no entren en conflicto con ella. Ésta es, precisamente, la tarea que se impone para solucionar el aparente conflicto: probar que naturaleza y libertad son compatibles, mostrando que ambas alternativas se pueden cumplir simultáneamente y desde un punto de vista distinto en un mismo acontecimiento, sin contradecirse.62 En clara semejanza con Kant, Hilbert sostiene que la extensión de la matemática finitista mediante nociones ideales está sujeta a la condición de que el sistema extendido sea no contradictorio. 4. En 1930 Paul Bernays, principal colaborador de Hilbert en esta empresa, puntualizó su posición (y la de Hilbert) con relación a la proyectada prueba de consistencia.63 Por el lado filosófico, Bernays rebate la idea de que una prueba de consistencia de la aritmética justifica por sí misma la introducción de nociones ideales en la teoría.64 Dice al respecto que sería injusto imputarles tal determinación, pues ha sido la ciencia aritmética la que ha llevado a cabo tal incorporación, siendo la 61 Kant denomina ideas de razón a las nociones cuyos objetos no pueden ser dados en ninguna experiencia posible. Al respecto, admite la posibilidad de extender el conocimiento mediante la adjunción de nociones ideales a condición de que el sistema amplificado no sea contradictorio. No obstante, advierte que tal extensión no acrecienta el conocimiento teórico y que su función es meramente práctica, cuestión en la que Hilbert está de acuerdo, como en seguida veremos. 62 V. CRP, La antinomia de la razón pura, III. 63 Bernays, 1930. 64 Aquí por ‘aritmética’ Bernays entiende la combinación de la teoría de funciones, la teoría de los 214 4. E L PROGRAMA DE H ILBERT prueba de consistencia el único requisito que falta por cubrir. De lo que se trata, afirma, es de resguardar el principio de conservación (“permanencia”) de las leyes sobre el que se erige el edificio de la aritmética, el cual es sumamente importante para la sistematización científica en general. En este caso (el de la aritmética), el principio se manifiesta bajo la idea de la aplicabilidad ilimitada de las formas lógicas de juicio e inferencia usuales y la demanda de una formulación puramente objetiva de la teoría, libre de toda referencia a nuestra cognición.65 Señala que la aritmética desarrollada de esta manera ha sido sistemáticamente exitosa, fructífera y coherente en sus conclusiones, lo que la convierte en un sistema idóneo para tratar con sobriedad las relaciones entre los números y las magnitudes. Al respecto, lo único que falta en su opinión es reemplazar la mera evidencia empírica de su coherencia con un auténtico conocimiento de la misma. Este es el verdadero y único propósito de la prueba de consistencia. Al respecto, sostiene que pedir como condición para desarrollar la teoría que primero se pruebe su consistencia constituye un error. No se trata de “darle vida” de esa manera (más bien, son los matemáticos quienes se la han dado en la práctica), sino de ofrecer un fundamento lógico para la misma. En otras palabras: El verdadero propósito es alcanzar la certeza racional de que el edificio no será socavado por la incoherencia de sus consecuencias. En este sentido, probar la consistencia es tanto como ofrecer un argumento final de que la lógica clásica y la noción de infinito se pueden desarrollar sistemáticamente de manera confiable. Creemos importante subrayar el lugar que Hilbert y Bernays le otorgan en ese momento (1930) a la prueba de consistencia de la matemática clásica, el cual ya no corresponde a la postura adoptada por Hilbert hacia 1900. Ya no se trataba de asegurar la existencia matemática de los entes considerados, como lo propusiera Hilbert en una carta dirigida a Frege en 1899: “De la verdad de los axiomas usted deduce que no pueden contradecirse entre sí, mientras que yo, por mi parte, creo lo contrario, que cuando los axiomas no se contradicen entre sí, por ese motivo son verdaderos, y por ese motivo los objetos que definen existen.”66 (Esta cuestión ya fue tratada en la sección 1.7.2). Ahora se trataba simplemente de ofrecer un argumento concluyente de que la incorporación de nociones ideales en la teoría no produce efectos indeseados en ella. En cuanto a la matemática finitista Bernays dice algo más: Que una vez lograda la prueba de consistencia, nadie podría dudar de los resultados obtenidos a partir de los postulados de la aritmética, pues sus consecuencias jamás podrían contradecir un hecho reconocible en forma intuitiva como verdadero: “[. . . ] cuando reconocemos la consistencia de la aplicación de estos postulados, se sigue de inmediato que sus consecuencias intuitivamente significativas (i. e., significativas en la matenúmeros y el álgebra, “una teoría sin igual [. . . ], un aparato conceptual completo y exhaustivo que se halla al centro de las teorías científicas”. 65 Bernays, ibidem, p. 35. 66 Frege, 1980, pp. 38-41. 4.2. L A NATURALEZA DE LA MATEMÁTICA CLÁSICA SEGÚN H ILBERT 215 mática finitista) nunca podrán contradecir un hecho reconocible intuitivamente. En el caso de los enunciados finitistas, la determinación de su no refutabilidad equivale al establecimiento de su verdad.” (Bernays, 1930, p. 36). Bernays se apoya en la idea de que todo lo reconocible como verdadero en la matemática finitista es demostrable en el sistema aritmético. De otro modo podría suceder que el sistema probara enunciados finitistas falsos sin incurrir por ello en contradicciones (simplemente, la negación de lo demostrado no sería un teorema del sistema). Ésta y otras consideraciones similares dieron lugar en tiempos recientes a una polémica en torno al carácter de la extensión de la matemática finitista que Hilbert defiende. Por ejemplo, se discute sobre si la extensión es meramente instrumental. Por lo que a nosotros respecta, debemos diferir tales discusiones hasta el siguiente capítulo, pues éstas se apoyan en nociones y resultados que aún no hemos introducido como, por ejemplo, las de lenguaje de primer orden, sistema formal, cálculo lógico, predicado recursivo y extensión no creativa, así como en los teoremas limitativos de Kurt Gödel. Si bien en el siguiente apartado diremos algo respecto a este tema, su estricta consideración sólo será posible una vez llenados tales vacíos. Aún así, podemos fijar nuestra postura: si bien la extensión de la matemática clásica se puede entender como meramente instrumental, en términos generales la idea de la consistencia como única exigencia a toda teoría matemática sigue siendo válida, pues en el fondo de lo que se trata es de no tejer en el vacío, y nada más. Otra cosa es que eso no lo podamos probar como Hilbert pretende. 4.2.4. Un cambio en el punto de vista Entre el pensamiento de Hilbert en 1904 y el de la década de los años 20 hay grandes similitudes y diferencias. En ambos casos encontramos la misma convicción, la misma seguridad de que a la matemática se le puede dar un fundamento seguro. Sin embargo, en el segundo caso se percibe otra actitud, otra intención. Esencialmente, observamos dos diferencias. Por una parte, el reconocimiento de que la matemática tiene un objeto de estudio que le es asegurado independientemente de la lógica; por la otra, la sustitución del problema de la existencia matemática con la idea de que la matemática transfinita no es sino un recurso o método para probar enunciados finitistas. Por ejemplo, en ningún lugar de la conferencia dedicada a la noción de infinito en 1925 Hilbert menciona la necesidad de asegurar la existencia de conjuntos infinitos mediante una prueba de consistencia. Más bien, lo que a la sazón le preocupaba era probar la legitimidad y conveniencia de una matemática que con mucho había sobrepasado los límites impuestos por la evidencia intuitiva. Esto se lograría, en sus propias palabras, “mostrando que los modos de inferencia que emplean al infinito se pueden reemplazar por métodos finitos que lleva a los mismos resultados.” Como ya lo hemos señalado, esto equivale a entender la extensión de la matemática finitista propuesta por Hilbert como un mero aparato formal que facilita la prueba de 216 4. E L PROGRAMA DE H ILBERT enunciados finitistas y nada más. Como veremos, esto lo afirma o sugiere en varios pasajes de su obra. Para resumir: en [Hilbert, 1925] y [Hilbert, 1927], Hilbert sostiene que la matemática clásica es el resultado de adjuntar a la matemática finitista nociones y proposiciones ideales, junto con la maquinaria deductiva necesaria para preservar la lógica aristotélica. Esta situación se presenta a partir de la aritmética de los números naturales, la cual contiene enunciados ideales que nada significan por sí mismos y enunciados finitistas (ecuaciones e inecuaciones numéricas y combinaciones de éstas) que constituyen los enunciados reales de la teoría. Todos estos enunciados son gobernados por las mismas reglas de la lógica clásica. No está de más repetirlo, los enunciados ideales tratan con objetos y nociones ideales que no corresponden a nada en el ámbito de la sensibilidad o de la experiencia.67 Hilbert sostiene que la importancia de este procedimiento radica en que permite extender y completar las teorías matemáticas, yendo más allá de lo que garantiza el pensamiento intuitivo.68 En tales casos lo que procede no es discutir si la matemática está en posibilidad de conocer un mundo trascendente, sino considerar la teoría como un todo. Por ejemplo, lo que se debe esperar de la matemática clásica es que ésta conduzca a resultados numéricos correctos en las aplicaciones, sin tener en cuenta si para ello hubo de realizar una digresión por el infinito. Éste es precisamente el problema que a la sazón preocupa a Hilbert y que pretende resolver: si la matemática clásica es consistente, en ella no se podrán derivar proposiciones aritméticas falsas, pudiéndose confiar plenamente en ella. Es más, el éxito en esta empresa convertiría a la matemática clásica en un método de prueba para el intuicionismo, y la adjunción de nociones y proposiciones ideales probaría ser una poderosa herramienta que permitiría desarrollar la teoría con facilidad, dándole uniformidad y una base lógica independiente de la experiencia. Éste es el modo en que Hilbert intenta conciliar la matemática transfinita con la matemática finitista y refutar las críticas de Brouwer. A continuación se muestra de manera esquemática la idea que tiene Hilbert de la matemática clásica.69 67 Cf. Hilbert, 1927, página 470 de la traducción al inglés. significa, entre otras cosas, que tras su adopción no se debe esperar que cada proposición matemática sea verificable de manera individual. 69 Explicación de la figura. La matemática finitista forma parte de la matemática intuicionista, mas no se puede decir que coincida con ella, pues la segunda puede incorporar métodos que no corresponden a nada que esté dado en la intuición sensible. Por ejemplo, una demostración puede depender en exclusiva de construcciones del pensamiento (las aducidas por Brouwer), que sólo tratan con la posibilidad de disponer de objetos con ciertas características específicas. En casos como éste la seguridad de la construcción no necesariamente depende de intuiciones ligadas a la sensibilidad, sino de otro tipo de certezas como, por ejemplo, las basadas en el significado de ciertos conceptos. La figura también incorpora la idea de que la prueba de un enunciado finitista P (un enunciado intuicionista Q) puede dar un rodeo por la matemática transfinita, sugiriendo con ello que para Hilbert la extensión se puede pensar como un método de demostración, y que en ello radicaría el valor de las nociones ideales. 68 Esto 4.2. L A NATURALEZA DE LA MATEMÁTICA CLÁSICA SEGÚN H ILBERT 217 Figura 4.1. Esquema de la matemática clásica según Hilbert. Para Hilbert y Bernays la matemática finitista consiste en una especie de “reflexión directa acerca de un contenido que procede sin presupuestos axiomáticos y por medio de experimentos mentales sobre objetos imaginados en toda su concreción.”70 La diligencia de colocar esta forma de pensamiento al centro de la matemática es una abierta concesión a Brouwer, quien al igual que Kant le otorga primacía a la intuición y a la argumentación constructiva. En la matemática finitista nada hay que amenace la certeza de las conclusiones, ni existe la posibilidad de llegar a conclusiones discordantes. Aduce para ello que en la esfera de lo perceptible no hay lugar para la contradicción: “Siempre he creído que lo único que puede dar lugar a contradicciones son las afirmaciones y las hipótesis, en tanto que conduzcan, por medio de inferencias, a otras afirmaciones, por lo que la idea misma de una contradicción entre los hechos me parece un ejemplo paradigmático de descuido conceptual y absurdo.”71 Lo que Hilbert rechaza es que la matemática tenga como límite la esfera de lo intuitivo: éste es el sitio de discrepancia con Brouwer y de coincidencia con Cantor. Es más, considera que las propuestas de Brouwer y Kronecker son imposiciones arbitrarias que fijan límites a la matemática con base en concepciones filosóficas inadmisibles, pues la matemática se puede asegurar sin renunciar a sus conquistas ni recurrir a nada extraño. Esta postura se revela con toda claridad en el siguiente pasaje: La matemática es una ciencia sin presuposiciones. Para fundamentarla no necesito a Dios, como lo hace Kronecker, ni la suposición de una facultad especial de nuestro entendimiento en consonancia con el principio de inducción matemática, como lo hace Poincaré, o la intuición primaria de Brouwer, ni, finalmente, como lo hacen Russell y Whitehead, axiomas de infinitud, reductibilidad o completud que de hecho son suposiciones materiales que no se pueden compensar con pruebas de consistencia.72 70 Hilbert y Bernays, 1934, p. 32. 1925, p. 85. En efecto, si la matemática se restringiera –como en este caso– a la descripción de objetos concretos y a las relaciones lógicas entre tales descripciones, entonces ninguna antinomia podría producirse en ella. 72 Hilbert, 1927. Cita tomada de la traducción al inglés, pp. 464-479. En breve: para darle una base 71 Hilbert, 218 4. E L PROGRAMA DE H ILBERT La teoría cantoriana no es conocimiento de nada, pero es una extensión de una teoría que sí es conocimiento de algo, aunque ese “algo” pertenezca a una esfera muy reducida: se trata de objetos que podemos producir en el ámbito de la sensibilidad. Con ello Hilbert evita incurrir en suposiciones de carácter incierto a la vez que niega la vacuidad de las matemáticas. Más allá de este contenido mínimo, ni siquiera la lógica está presupuesta: los modos de argumentación prevalecientes entre las proposiciones finitistas nacen de la naturaleza de los objetos considerados. Asimismo, la ampliación de la lógica finitista a la lógica clásica no tiene como base consideraciones de orden metafísico u ontológico, sino un argumento que se escuda en la brevedad y economía de pensamiento. En cuanto a la conformación del programa de Hilbert, si bien no hemos faltado ni un ápice a la verdad, tampoco hemos narrado la historia completa. Para apreciar el verdadero sentido del proyecto (el cual transita por la reducción de la matemática clásica a un mero juego simbólico), debemos primero saber de la creencia de Hilbert en la certeza absoluta del razonamiento finitista, del lugar que le asigna a la lógica y de las condiciones que hacen posible el pensamiento matemático efectivo, así como detallar el radicalismo epistemológico al que Hilbert finalmente llegó y frente al cual el intuicionismo parece un derroche. 4.3. La intuición del signo Hilbert nunca dejó de insistir en la vía axiomática como único camino para resolver el problema de los fundamentos. En 1922 esto lo expresó con las siguientes palabras: El objetivo que nos hemos propuesto es entonces el de dar un fundamento seguro a las matemáticas. Nuestra intención es devolver a nuestra disciplina el antiguo prestigio de consistir de verdades indiscutibles, del que las paradojas de la teoría de conjuntos parecieron despojarla. Tenemos la firme convicción de que esto es realizable y que no significa ningún tipo de renuncia a sus partes constitutivas. El método adecuado para la realización de estos fines es, por supuesto, el método axiomático.73 Para entonces Hilbert estaba convencido de dos cosas: primero, que la axiomática y el intuicionismo no eran incompatibles, como sostuvieran Weyl y Brouwer;74 segundo, que para resolver el problema de los fundamentos no había que salir de la matemática, sino probar su consistencia al interior de ella misma. segura a la matemática no es necesario recurrir a suposiciones como que es obra de Dios, que poseemos facultades especiales o que ésta está referida a un mundo inmaterial de esencias matemáticas. 73 Hilbert, 1922. Cita tomada de la traducción al español, p. 41. 74 Hilbert incluso va más allá de esto, al asegurar, respecto a las tendencias constructivistas, que la vía axiomática es la única capaz de hacerles justicia. Cf. Hilbert, 1922, p. 41 de la traducción al español. 4.3. L A INTUICIÓN DEL SIGNO 219 En la filosofía sí ha sido reconocida la importancia del problema de la consistencia de los axiomas de un sistema. Sin embargo, en la literatura existente al respecto no hemos logrado encontrar ninguna exigencia clara de solución de este problema en un sentido matemático. Por el contrario, los viejos esfuerzos por fundamentar la teoría de los números y el análisis en la teoría de conjuntos y ésta en la lógica tocan el núcleo mismo de toda esta problemática. 75 Fue entonces que retomó el problema de una prueba directa de la consistencia y anunció la creación de una teoría de la demostración [Beweistheorie] cuyo objetivo sería someter a un análisis exhaustivo la demostración matemática.76 No obstante, la justificación última de su proyecto la debió encontrar en el plano filosófico, donde hubo de aventurarse hasta precisar las intuiciones básicas sobre las que, considera, se apoya el conocimiento matemático. Como a continuación veremos, Hilbert halló en el apriorismo kantiano una fuente de inspiración, aunque para él dicho a priori no va más allá de la intuición del signo, base de la matemática finitista. En efecto, así como Russell buscó en la lógica la fuente del conocimiento matemático, extrayendo de la primera el contenido de lo segundo y Brouwer la halló en la intuición temporal kantiana, Hilbert creyó encontrarla en el dominio de la intuición sensible. En particular, considera que si bien el pensamiento matemático ha de proceder con apego a la lógica, ello no significa que haya de extraer su contenido de la misma. Por el contrario, no hay tal cosa como el pensamiento lógico puro: la lógica es un constituyente imposible de aislar del pensamiento matemático efectivo, el cual actúa sobre objetos que le son dados al margen de la lógica. En otras palabras, las operaciones lógicas que tienen lugar en el pensamiento matemático efectivo se aplican, no a meras formas lógicas, sino a objetos concretos dados previamente en la intuición, cuya presencia es una condición necesaria para aplicar la lógica con seguridad. Es más, la posibilidad de ejercer el pensamiento de manera efectiva descansa en nuestra aptitud para captar dichos objetos en todos sus aspectos, que en el caso de la matemática son los signos. Estos supuestos filosóficos, básicos para su proyecto de fundamentación, Hilbert los enunció por vez primera en 1922: Como hemos visto, el manejo abstracto de las extensiones de conceptos y de los contenidos ha mostrado ser no sólo insuficiente, sino también bastante inseguro. Más bien, lo que se hace necesario como medida previa a la aplicación de inferencias y operaciones lógicas es la existencia en la 75 Hilbert, op. cit., p. 43. Cuando habla de “los viejos esfuerzos por fundamentar la teoría de los números y el análisis en la teoría de conjuntos y ésta en la lógica” Hilbert se refiere a Frege, Dedekind y Russell, cuyos proyectos los consideraba condenados al fracaso. 76 Recordemos las siguientes palabras de Hilbert: “Hemos dicho ya que para realizar nuestros objetivos tenemos que hacer de las demostraciones mismas el objeto de nuestra investigación. Nos vemos obligados así a desarrollar una teoría de la demostración, cuya materia de estudio la constituye el manejo y la operación de las demostraciones mismas.” [Hilbert, 1922. Cita tomada de la traducción al español, p. 53.] 220 4. E L PROGRAMA DE H ILBERT representación [Vorstellung], como algo dado, de ciertos objetos extralógicos discretos, intuitivamente presentes antes de cualquier pensamiento como vivencia inmediata. Si la inferencia lógica ha de tener la seguridad que deseamos, estos objetos deben ser susceptibles de una visión global y completa de todas sus partes, y su postulación, distinción y sucesión deben presentarse ante nosotros de inmediato con los objetos mismos de manera intuitiva, como algo irreductible. En este enfoque, en clara y explícita oposición a Frege y Dedekind, son los signos mismos los objetos de la teoría de los números. Entendemos aquí por signo algo cuya forma es independiente del espacio y del tiempo, así como de las condiciones especiales en las que se produce, de las variaciones insignificantes en su trazado y que, en general y de manera segura, puede ser identificado.77 El enfoque que consideramos adecuado y necesario para la fundamentación no sólo de las matemáticas puras, sino en general de todo el pensamiento, la comprensión y la comunicación científicas, puede entonces expresarse en una frase diciendo: en un principio era el signo.78 Hilbert refrendó este punto de vista en 1925 al señalar su coincidencia con Kant: el matemático, para ejercer el pensamiento efectivo, necesita de la previa existencia de objetos concretos, presentes directamente en la intuición e irreductibles a cualquier otra cosa. Recordemos el siguiente pasaje, tantas veces citado: [...] Y ¿no estará fallando en alguna parte la inferencia lógica concreta [das inhaltliche logische Schliessen] y dejando de satisfacer nuestras expectativas cuando la aplicamos a objetos o sucesos reales? La respuesta a esto último es definitivamente negativa. La deducción lógica concreta es absolutamente indispensable. Sólo puede conducirnos a errores cuando aceptamos construcciones conceptuales arbitrarias, en particular aquellas que se aplican a una infinidad de objetos. Lo que en tales casos ha sucedido es que hemos usado de manera ilícita la inferencia lógica concreta, es decir, hemos hecho caso omiso de las condiciones previas y necesarias para su aplicación. Por lo demás, en esta observación relativa a las condiciones de aplicabilidad de tales deducciones e inferencias y de la necesidad de su cumplimiento satisfactorio coincidimos plenamente con los filósofos, en particular con Kant. 77 En este sentido, llamaremos “el mismo signo” a aquellos signos que tengan la misma forma [nota de Hilbert]. 78 Hilbert, 1922. Cita tomada de la traducción al español, pp. 44-45. 4.3. L A INTUICIÓN DEL SIGNO 221 Kant nos enseña, en efecto, en una de las partes centrales de su filosofía, que las matemáticas poseen un contenido [Inhalt] propio e independiente de la lógica, y que, en consecuencia, ésta no puede nunca constituir por sí sola un fundamento para aquéllas. Se sigue de esto que los intentos de Frege y Dedekind estaban desde un principio condenados al fracaso. La existencia de algo dado en la representación, de ciertos objetos extralógicos concretos, presentes intuitivamente como vivencia inmediata, previa a todo pensamiento, es una condición necesaria para la aplicación de las inferencias lógicas y el funcionamiento de las operaciones de este tipo. Es necesario entonces, si es que hemos de tener a nuestra disposición deducciones e inferencias lógicas confiables, que los objetos sean susceptibles de una visión global completa de todas sus partes y que su presencia, sus diferencias mutuas, su ordenación, su sucesión o su concatenación acompañe a los objetos, al mismo tiempo, como algo dado de manera inmediata en la intuición, como algo irreductible a cualquier otra cosa, como algo que no requiere de ninguna reducción. Ésta es la concepción fundamental que, en mi opinión, resulta necesaria no sólo para las matemáticas, sino también para todo pensamiento, toda comprensión y toda comunicación con carácter científico. En el caso particular de las matemáticas, el objeto preciso de nuestro examen lo constituyen los signos concretos mismos, cuya forma es, en consonancia con el punto de vista que hemos adoptado, inmediatamente clara y reconocible.79 Para Hilbert, los objetos del conocimiento matemático no son entidades ideales. Por el contrario, la realidad asequible al pensamiento matemático se sitúa en la esfera de lo signos concretos –únicos objetos de su conocimiento– y no en un mundo ideal, platónico. De aquí la importancia de la matemática finitista: el conocimiento matemático no puede ir más allá de lo que ésta puede alcanzar. En lo que sigue examinamos con mayor detenimiento el punto de vista de Hilbert expresado en esta sección. 1. Para Hilbert, el error de Frege y de Dedekind al tratar de fundamentar la matemática fue que se apoyaron en suposiciones extrañas a la matemática como, por ejemplo, que la extensión de un concepto es algo dado sin más (Frege), o que existe tal cosa como el sistema de todos los objetos (Dedekind). Si algo había que aprender de todo esto, era que la matemática no podía depender de suposiciones de esta naturaleza y que debía ser ella misma la que resolviera el problema de sus 79 Hilbert, 1925. Cita tomada de la traducción al español, pp. 94-95. 222 4. E L PROGRAMA DE H ILBERT fundamentos, profesando con ello una especie de filosofía matemática. De ahí la necesidad de la teoría de la demostración. 2. A fin de no incorporar la matemática al dominio de la lógica, entendida ésta a la manera de Russell, Hilbert le asigna a la primera un objeto de estudio independiente de la segunda: los signos concretos. Y así como para Russell tanto la certeza como la exactitud de la matemática son consecuencia de su pretendida reductibilidad a la lógica, para Hilbert dicha certeza reside en la posibilidad de “captar” de inmediato y con toda claridad sus objetos, lo cual no puede celebrarse sino en la intuición sensible, esto es, en el ámbito de la percepción. Así, la solidez del pensamiento matemático descansa, según Hilbert, en la intuición del signo, la cual, en palabras de Jean Ladrière, disfruta de una “evidencia privilegiada”.80 3. Para Hilbert, la lógica no es una disciplina autónoma con un objeto propio. Más bien, es algo común a todas las disciplinas científicas, las cuales la desbordan de la misma manera; se trata, como dice Cavaillès, de “un constituyente, imposible de aislar, de todo pensamiento que funciona verdaderamente”.81 Es por ello que la lógica y la matemática se deben desarrollar simultáneamente, haciendo explícitos desde el principio los procedimientos lógicos aceptados. Si la lógica llevó a contradicciones en el pasado, ello se debió a que, perdida en el vacío, se le dio un objeto falso: el infinito actual. He ahí la causa de las paradojas. 4. Hilbert no argumenta en contra de la teoría de tipos de Russell y Whitehead en virtud de que parte de sus intereses se centran en la teoría cantoriana, y de que la teoría de Zermelo-Fraenkel ha probado ser un mejor sustituto que aquélla. Más allá de considerar irrealizable la reconstrucción de la aritmética a partir de la lógica, de Whitehead y Russell lo que toma es su lenguaje simbólico. 5. Hilbert está persuadido de que el pensamiento finitista es infalible. Esta creencia se funda en el convencimiento de que el pensamiento finitista se adecua perfectamente a la realidad que pretende estudiar, ya que ésta le es accesible en todos sus aspectos. 6. Con relación a los signos, sería un error pensar que Hilbert les atribuye una existencia independiente del entendimiento, en un reino platónico. Desde cualquier punto de vista, esto es una equivocación. La existencia a la que Hilbert hace referencia sólo tiene lugar en la imaginación o en la intuición sensible. Es indudable que por “signo” Hilbert entiende algo más general que los trazos sobre el papel. No obstante, esto último no lo debemos entender en un sentido trascendente. Por ejemplo, cuando afirma que “el signo es algo cuya forma es 80 Cf. Ladrière, 1957. Cita tomada de la traducción al español, p. 27. 1938. Cita tomada de la traducción al español, p. 92. 81 Cavaillès, 4.3. L A INTUICIÓN DEL SIGNO 223 independiente del espacio y del tiempo, así como de las condiciones especiales en las que se produce”, su pretensión no es la de situarlo en un mundo ideal, sino en el lugar que de manera espontánea se le otorga en la matemática o, en general, por quienes son capaces de leer y escribir. Si la forma de los signos se considera independiente del tiempo y del espacio, es porque así nos servimos de ellos. Observe usted la siguiente imagen de un manuscrito matemático: ¿Cuántas presencias de la variable x reconoce el lector? ¿Cuántas referencias hay en él a la función coseno? ¿Y al número π, o a la suma? Si usted reconoce en lo anterior un manuscrito matemático, tácitamente estará aceptando que tiene la capacidad de distinguir las distintas presencias de un mismo símbolo en la hoja manuscrita, aunque como meras marcas (manchas) sobre el papel sean diferentes. Justo a eso se refiere Hilbert. De cierta manera, en la escritura con lo que tratamos es con clases de inscripciones, cuyos elementos corresponden a una misma forma (lo cual se expresa diciendo que son equiformes), y que en la práctica identificamos con los signos concretos. A esto nos referimos cuando decimos que “un mismo signo se hace presente en varios sitios a la vez”, que “figura” en diversos lugares, tal como las letras lo hacen en esta página escrita. La posibilidad de identificar una multitud de inscripciones como instancias de un mismo signo es una facultad del entendimiento, lo cual nada tiene que ver con que los signos tengan existencia propia: la noción de “inscripciones equiformes” se origina de un modo natural en el ámbito de la sensibilidad cuando, repito, aprendemos a leer y a escribir, y tiene como base nuestra capacidad para reconocer de manera inmediata la forma de los objetos intuidos.82 82 En la frase “intuición del signo” nosotros pondríamos el énfasis en la intuición, no en el signo, la cual es un hecho cotidiano en la matemática. Observamos figuras, manejamos guarismos, manipulamos expresiones simbólicas sin siquiera reparar en ello. En ocasiones llevamos a cabo largos cálculos con la sola consideración de las expresiones y algunas reglas formales para su manejo (esto es especialmente notorio en la aritmética y en el álgebra elemental). La seguridad que se tiene en el manejo de tales 224 4. E L PROGRAMA DE H ILBERT Podemos decir entonces que en cuanto al modo de ser de los objetos matemáticos, Hilbert adopta un punto de vista nominalista, según el cual la única realidad matemática es la de los signos concretos, evitando de este modo suponer que la matemática es conocimiento de una realidad suprasensible, constituida por entes abstractos y universales. 7. En cuanto a Kant, si bien no podemos decir que Hilbert representa la renovación de su punto de vista al interior de la filosofía matemática moderna –se podría reclamar el mismo derecho para Brouwer, que riñe con él–, en su obra filosófica hay constantes referencias y coincidencias con el filósofo de Königsberg. Por ejemplo, el “signo”, tal como lo concibe Hilbert, cae dentro del concepto de intuición pura kantiano, aunque Hilbert no utiliza esta terminología. Dice Kant: Las representaciones en las que no se encuentra nada perteneciente a la sensación las llamo puras (en sentido trascendental). Según esto, la forma pura de las intuiciones sensibles en general, donde se intuye en ciertas relaciones toda la diversidad de los fenómenos, se hallará a priori en el psiquismo. Esta forma pura de la sensibilidad se llamará igualmente intuición pura. Así, al apartar de la representación de un cuerpo lo que el entendimiento piensa de él, –sustancia, fuerza, divisibilidad, etc.– y al apartar igualmente lo que en dicha representación pertenece a la sensación –impenetrabilidad, dureza, color, etc.– me queda todavía algo de esa intuición empírica, a saber, la extensión y la figura. Ambas pertenecen a la intuición pura, y tienen lugar en el psiquismo como mera forma de la sensibilidad, incluso prescindiendo del objeto real de los sentidos o de la sensación.83 En términos kantianos, los signos escritos serían intuiciones empíricas y los signos en general intuiciones puras. Podemos decir entonces que Hilbert limita la intuición espacio-temporal de Kant a configuraciones con un número finito de objetos discretos –esto es lo que quiere decir cuando se refiere al Anschauung– y basa en ella su creencia de que el verdadero contenido de la matemática se encuentra en la matemática finitista. expresiones descansa, en última instancia, en la intuición sensible. Por ejemplo, tras observar que en la ecuación 3xy − x = 5xy − x + 2 la expresión “˘x” figura en ambos lados del signo “=”, escribimos de inmediato la igualdad 3xy = 5xy + 2 (con base en la ley de cancelación de términos iguales) sin importar el significado de los signos “x”, “=”, “2”, etc. ¿Cómo puede ser esto? En parte, porque hemos reconocido la misma expresión “−x” en ambos lados del signo “=”. Si no pudiéramos reconocer las distintas presencias de un mismo signo, todas las inscripciones sobre el papel serían “distintas” y no reconocibles como equiformes. En todo caso, el origen de la discusión se debe al afán de explicar qué es lo que Hilbert entiende por “signo”, cuando en la práctica matemática esto es algo obvio y claramente entendido, tan obvio que pasa desapercibido y ni siquiera es objeto de discusión (como cuando leemos un texto). No debemos olvidar que Hilbert se dirige fundamentalmente a la comunidad matemática, a la que quiere convencer de la bondad de su proyecto. 83 Kant, CRP, B36. 4.3. L A INTUICIÓN DEL SIGNO 225 Es precisamente esta insistencia de Hilbert en el conocimiento concreto lo que hace tan débil a la matemática finitista, pues excluye muchas cosas que son en general aceptadas como evidentes en la teoría elemental de los números. Esta cuestión será examinada con mayor detenimiento en el siguiente inciso. 8. Hilbert ve en la reflexión finitista una forma de discernimiento intuitivo en el que el pensamiento básico y general de Kant retiene su importancia, a condición de que el a priori no se considere más que la expresión de ciertas condiciones preliminares e indispensables para el pensamiento y la experiencia. Esta posición la fija con toda claridad en el siguiente pasaje: Los filósofos han mantenido –y Kant es el clásico representante de este punto de vista– que junto a la lógica y la experiencia tenemos cierto conocimiento a priori de la realidad. Yo admito que en la construcción del marco teórico son necesarios ciertos discernimientos a priori y que éstos siempre están detrás de la génesis de nuestro conocimiento. También creo que el conocimiento matemático se apoya en última instancia en cierta clase de discernimiento intuitivo [anschaulicher Einsicht]84 de este tipo e incluso que para construir la teoría de los números necesitamos cierta perspectiva intuitiva y a priori. Así, la idea más general y fundamental de la epistemología kantiana retiene su significancia: a saber, el problema filosófico de determinar dicha perspectiva intuitiva y a priori y de ese modo investigar las condiciones de posibilidad de todo conocimiento conceptual y toda experiencia. Yo creo que en esencia eso ha ocurrido en mis investigaciones en torno a los principios de la matemática. El a priori no es otra cosa que una perspectiva fundamental, o la expresión de ciertas condiciones previas indispensables al pensamiento y a la experiencia. Pero nosotros debemos trazar en forma diferente la frontera entre lo que poseemos a priori y lo que se requiere de la experiencia: Kant sobrestimó el papel y el alcance del a priori.85 Tras largas consideraciones, en las que muestra cómo la epistemología, sacudida por la ciencia moderna, se vio forzada a abandonar los apriorismos espacial y temporal de Kant, Hilbert llega a la siguiente conclusión: “la teoría kantiana del a priori aún contiene impurezas antropológicas de las que debe ser liberada; después, sólo queda la actitud [Einstellung] a priori que también subyace al conocimiento matemático puro: esencialmente, la actitud finitista que he caracterizado en diverso 84 En alemán el adjetivo “Anschaulich” se utiliza para indicar que algo es gráfico, expresivo, claro o evidente y el sustantivo “Einsicht” además de ‘discernimiento’ también significa juicio, vista, inspección, examen, comprensión, conocimiento e inteligencia. Anschaulicher Einsicht: “comprensión sensible” es otra traducción de las palabras utilizadas por Hilbert. 85 Hilbert, 1930. Cita tomada de la traducción al inglés, pp. 1961-1962. 226 4. E L PROGRAMA DE H ILBERT trabajos.”86 Esta actitud es lo que hemos identificado como la intuición espaciotemporal limitada a configuraciones finitas y discretas. La idea de que la intuición del signo nos permite reconocer algunas propiedades generales de los números cuando se le aplica, por ejemplo, a los numerales, se asemeja a la idea de Kant de que la intuición geométrica nos permite reconocer propiedades generales de las figuras cuando se le aplica a una construcción particular (véase lo dicho al respecto en la sección 1.4). En general, el pensamiento básico de Kant sigue presente en la reflexión finitista. Por ejemplo, la confianza que Hilbert deposita en la intuición del signo ya se encuentra en Kant, quien al referirse al álgebra se expresa con las siguientes palabras: El mismo procedimiento del álgebra con sus ecuaciones, a partir de las cuales, por reducción, produce la verdad juntamente con su prueba, aunque no es una construcción geométrica, es una construcción característica por la cual se presentan en la intuición los conceptos a través de los signos, especialmente los que se refieren a relaciones de magnitud. Aun sin atender a su elemento heurístico, este método garantiza la ausencia de errores en todas las inferencias por el hecho de poner a la vista cada una de ellas.87 Tal parece que Hilbert se inspiró en este pasaje al momento de idear la formalización. Al igual que en el álgebra, en un sistema formal las pruebas son figuras expuestas a la mirada, y la presencia de una contradicción se manifestaría en la existencia de dos pruebas formales que concluirían en fórmulas contradictorias, de las formas A y ¬A. De este modo, Hilbert vio en la formalización una manera de transformar el problema de la consistencia en un problema relativo a un juego reglamentado de símbolos, es decir, en una cuestión que caía directamente en el ámbito de la intuición del signo y la matemática combinatoria. 9. En general, la actitud de Hilbert ante la matemática consiste en evitar toda postura que atribuya a sus conceptos un “contenido objetivo” más allá de lo que garantiza la evidencia sensible. Por ello su insistencia en desarrollar las teorías dentro de un marco axiomático, para así evitar en todo momento recurrir al significado que se le pueda dar a sus términos y relaciones, ocupándose tan sólo del despliegue de dichas relaciones. Hilbert abriga con la axiomática una postura antimetafísica, evitando con ello asumir un trasmundo de esencias matemáticas o una intuición primigenia que va más allá de la intuición del signo. Digamos que Hilbert actúa con incredulidad ante el problema de las esencias matemáticas y sólo adopta el mínimo indispensable para fundamentar la matemática, como diciendo, concédanme al menos la intuición del signo, pues sin ella la matemática es, literalmente, ciega y vacía. 86 Hilbert, op. cit, p. 1163. En una nota al pie de página, Hilbert se refiere a [Hilbert, 1925] como uno de tales trabajos. 87 Kant, CRP B762. 4.4. E L PROGRAMA 227 10. Con relación al problema de los fundamentos, lo que Hilbert hace es señalar aquellas intuiciones sobre las que considera se sustenta el conocimiento matemático. Al respecto, llama la atención el siguiente pasaje de Jean Ladrière: Si en el pasado se habían suscitado falsas evidencias fue porque se había creído poder conseguir mediante la intuición verdades o conceptos abstractos. Regresando a la intuición sensible del signo, y limitándose estrictamente a ella, puede caminarse por un terreno sólido en que la adecuación entre el pensamiento y el objeto no puede dejar de producirse, asegurando al pensamiento esta objetividad absoluta que debe constituir el ideal del matemático y de cualquier hombre de ciencia.88 A partir de 1922 la epistemología matemática de Hilbert tuvo como base esta posición tan radical, mucho más tajante que las de Kronecker y Brouwer quienes, más allá del finitismo, aceptan como evidentes ciertas intuiciones no necesariamente relacionadas con la sensibilidad (v. gr., intuiciones puras ligadas al principio de inducción). En este sentido, para Hilbert el único terreno sólido sobre el cual se puede apoyar una prueba de consistencia es la matemática finitista, pues sólo ahí se puede alcanzar la certeza absoluta.89 4.4. El programa 4.4.1. La formalización Tras fijar las bases sobre las que se asienta la teoría de la demostración, veamos cómo pretende Hilbert demostrar la consistencia absoluta de la matemática clásica. Como ya lo hemos visto, la presentación axiomática es inapropiada para este propósito: una teoría axiomática es un objeto mal definido del pensamiento y es parte esencial del pensamiento finitista sólo ser aplicable a entidades simbólicas. Ni la representación de la teoría en el ámbito de la intuición ni el estudio combinatorio de su estructura deductiva se puede lograr con la mera axiomatización. Para ello sólo había un camino: la formalización.90 Se podría pensar que Hilbert debió realizar un gran esfuerzo para llevar a cabo dicha tarea; no obstante, lo que sucedió fue lo contrario: los medios para hacerlo ya habían sido creados por Russell y Whitehead,91 aunque por otras razones. 88 Ladrière, 1957. Cita tomada de la traducción al español, p. 28. última condición es inevitable: una prueba de consistencia es una demostración acerca de las demostraciones, con lo que se corre el peligro de caer en la falacia de la petición de principio, consistente en probar algo a partir de otra cosa que no es epistemológicamente anterior a ella (en cuyo caso lo más conveniente es asumir como principio aquello que se intenta probar). 90 La diferencia entre la axiomatización de una teoría y su formalización (en el estricto sentido de Hilbert) se irá aclarando en esta sección. Básicamente, consiste en hacer explícitos el lenguaje simbólico y los principios lógicos que se utilizarán. 91 Éstos, a su vez, siguiendo a Frege y a Peano. 89 Esta 228 4. E L PROGRAMA DE H ILBERT En efecto, en Principia Mathematica Russell y Whitehead habían mostrado que la matemática clásica se podía reconstruir utilizando, en lugar del lenguaje ordinario, una especie de estenografía o lenguaje simbólico en el que sus enunciados quedaban representados mediante fórmulas. Es más, sus creadores no sólo se limitaron a desarrollar dicho lenguaje, sino que fueron más lejos: reunieron suficientes evidencias como para convencerse y convencernos de que todas las demostraciones de la matemática clásica se podían reducir a unas cuantas reglas de razonamiento muy simples, reglas que sólo se referían a combinaciones de fórmulas sin tomar en cuenta su significado. Justo lo que Hilbert necesitaba. Como por arte de magia, la herramienta apropiada para formalizar la demostración ya estaba preparada, situación a la que él se refiere como “un suceso afortunado”, aunque no poco frecuente en la historia de la ciencia.92 Para adaptarla a sus propósitos, Hilbert sólo tuvo que hacer algunos cambios en la presentación. Es evidente –dice Hilbert– que este cálculo [lógico]93 se creó en el marco de una perspectiva completamente diferente a la nuestra. De acuerdo con este enfoque, los signos del cálculo lógico se introducen como un medio de comunicación. Resulta consecuente con el curso que hemos seguido despojar ahora a los signos lógicos, lo mismo que a los signos matemáticos, de cualquier significado. Según esto, las fórmulas del cálculo lógico no poseen absolutamente ningún significado; todas ellas son ahora enunciados ideales.94 Pero, ¿en qué consiste la formalización? Básicamente, en liberar de todo contenido a los símbolos que intervienen en la construcción de una teoría matemática, compensando el correspondiente vacío semántico con la introducción de signos complementarios y un manejo formal de los mismos, incluyendo reglas para la construcción de las fórmulas y la deducción lógica. Por tanto, la formalización requiere que la teoría se reconstruya desde abajo, comenzando por su lenguaje. En el caso de la matemática clásica podemos describir el procedimiento como sigue:95 1. En primer lugar, es preciso enumerar todos los símbolos lógicos y matemáticos de la teoría. Estos símbolos, denominados primitivos, deben incluir símbolos especiales para las operaciones lógicas, como lo son el símbolo ¬ para la negación, 92 En particular, Hilbert menciona el caso de Einstein, quien encontró ya listo el cálculo general de invariantes al momento de desarrollar su teoría general de la gravitación. 93 Hilbert utiliza esta voz, hoy en desuso, para referirse al sistema de Russell y Whitehead y afines. En la actualidad, por “cálculo lógico” se entiende el cálculo de predicados. 94 Hilbert, 1925. Cita tomada de la traducción al español, p. 103. 95 La descripción la hacemos en conformidad con la notación y terminología actuales. Las diferencias con respecto a Hilbert son de matiz. Por ejemplo, Hilbert no especifica con detenimiento el lenguaje, su notación ha caído en gran medida en desuso, (v. gr., el símbolo ε) y su presentación axiomática se ha simplificado con el paso del tiempo. Empero, más allá de estas diferencias un tanto superficiales, las ideas siguen siendo las mismas. Quienquiera que haya llevado un curso de lógica matemática estará familiarizado con ellas y podrá omitir estos pasajes. 4.4. E L PROGRAMA 229 las conectivas ∧ (y), ∨ (o), → (implica) y ↔ (si y sólo si), los cuantificadores ∀ (para todo) y ∃ (existe), un conjunto numerable de variables x, y, z, x1 , y1 , z1 , x2 , y2 , z2 , . . . y un símbolo = para la igualdad.96 2. En segundo lugar, es preciso caracterizar sin ambigüedad todas las combinaciones de símbolos primitivos que representan enunciados de la teoría. A estas combinaciones se les llama fórmulas. 3. En tercer lugar, es preciso suministrar un procedimiento que permita construir en forma sucesiva todas las fórmulas que corresponden a los enunciados demostrables en la matemática clásica. A este procedimiento de derivación formal se le llama prueba y a las fórmulas con él obtenidas, teoremas. Esto último se logra definiendo la noción de prueba como sigue: a) Ciertas fórmulas, caracterizadas efectivamente y sin ambigüedad, se postulan como axiomas de la teoría. b) Ciertas reglas formales, caracterizadas efectivamente y sin ambigüedad, se postulan como reglas de inferencia. Cada regla de inferencia debe indicar cómo se pasa de un conjunto finito de fórmulas, llamadas hipótesis, a otra fórmula, llamada conclusión. En cada caso se dice que la conclusión se infiere de las hipótesis. En este contexto una prueba o derivación se define simplemente como una sucesión finita de fórmulas, cada una de las cuales es un axioma o se infiere de otras fórmulas que le anteceden en la sucesión por medio de alguna regla de inferencia. A la última fórmula de una prueba se le llama teorema.97 Un sistema de esta naturaleza constituye, en palabras de Hilbert, “un lenguaje de signos con la capacidad no sólo de reflejar en sus fórmulas las proposiciones matemáticas, sino igualmente de expresar por medio de procesos formales las inferencias lógicas.”,98 y añade: 96 Los símbolos propiamente matemáticos dependen, en general, de la teoría que se formaliza: signos especiales para las relaciones (v. gr., relaciones de orden, incidencia, divisibilidad, etc.), otros para las operaciones básicas de la teoría (operaciones como la suma, el producto, etc.) así como algunas constantes individuales para representar en el formalismo ciertos elementos distinguidos (v. gr., el número cero, la transformación idéntica, etc.). Por tanto, deberá haber un símbolo de función para cada operación básica considerada, un símbolo de relación para cada relación básica considerada, y una constante individual para cada constante considerada. Básicamente, el lenguaje será el de la lógica de predicados. Nosotros no iremos a través de tantos detalles. Al respecto, el lector podrá consultar los apéndices M, Ñ y O. 97 Como se ve, la empresa de la formalización requirió de dos tareas complementarias: primero, sustituir el lenguaje usual, con sus numerosas irregularidades, con un lenguaje de signos desprovistos de todo significado; segundo, describir los axiomas que habían de servir como punto de partida para la demostración y especificar las reglas de inferencia a utilizar. Ciertamente, los procedimientos recién descritos siguen vigentes en la actualidad, aunque la noción de formalismo se ha generalizado con el concepto de sistema formal que exponemos debidamente en el apéndice L y cuya lectura consideramos indispensable. 98 Hilbert, op. cit., p. 103. 230 4. E L PROGRAMA DE H ILBERT [Al formalizar] en lugar de la ciencia matemática concreta, lo que en último término obtenemos con todo ello es un inventario de fórmulas que contienen signos tanto lógicos como matemáticos, y que se ordenan según reglas definidas. Algunas de estas fórmulas corresponden a los axiomas matemáticos, y ciertas reglas (de acuerdo con las cuales ciertas fórmulas se siguen de otras) corresponden a la inferencia concreta. En otras palabras, la inferencia concreta es reemplazada por un manejo externo [äusseres Handeln] según reglas. Con ello se realiza de manera estricta el tránsito del tratamiento intuitivo e ingenuo a uno formal.99 Fue así como Hilbert, en su obstinación por lograr una prueba de consistencia absoluta –es decir, con base en un mínimo de suposiciones–, llegó a la idea de que la matemática clásica se podía reducir a un cálculo simbólico (reduccionismo).100 Si bien éste es un tema que aún se debate (sobre todo a partir de la obra de Gödel), podemos decir, retomando un lenguaje más cercano a la filosofía, que con la formalización lo que Hilbert pretende es convertir la inferencia lógica en algo concreto, dable en la percepción, y aislar el lenguaje de todos los significados y objetos que le fueron dados en el pasado (v. gr., el infinito actual). 4.4.2. Posibilidad de una prueba finitista de consistencia Ciertamente, al formalizar una teoría lo que resulta es un sistema de signos en el que la demostración es la figura central y en el que, a diferencia de la matemática usual, cada prueba se puede examinar de manera exhaustiva. Quizá un ejemplo baste para ilustrar las diferencias entre la demostración en una teoría informal, en una teoría axiomática y en un sistema formal.101 Para ello, consideremos un conocido teorema de la teoría elemental de los conjuntos y veamos cómo se le demuestra en cada caso. El teorema es el siguiente: Si A ⊆ B y B ⊆ C, entonces A ⊆ C 99 Hilbert, op. cit., pp. 103-104. veremos, las investigaciones de Gödel parten de la duda de que este proyecto sea factible. 101 La definición del concepto de sistema formal es más general y rigurosa que lo dicho en estas páginas, en donde sólo nos hemos referido a la idea de formalizar, es decir, de suplantar una teoría axiomática con un sistema de signos con ciertas características. Para no distraer la atención del lector con demasiadas cuestiones técnicas, hemos enviado al apéndice L la definición precisa de este concepto, así como un ejemplo en el que exponemos con todo detalle un sistema formal que no formaliza ninguna teoría. Recomendamos ampliamente su lectura a quienes no tienen pleno dominio de estos temas. La idea es mostrar el grado de arbitrariedad que puede haber al momento de definir un sistema de esta índole y poner en relieve el hecho de que el manejo de esta clase de sistemas es mecánico, sin tomar en cuenta lo que sus símbolos pudieran significar (en el ejemplo esto queda claro en virtud de que en este caso no se tiene ningún indicio de los que pudieran significar las fórmulas del sistema que ahí exponemos); este ejercicio sirve, además, para ilustrar el carácter finitista de la metamatemática, que pronto habremos de abordar. Además, en el apéndice Ñ el lector encontrará un sistema formal para la teoría axiomática de Zermelo-Fraenkel y otro para la aritmética de Peano de primer orden en el apéndice O. 100 Como 4.4. E L PROGRAMA 231 i. prueba en la teoría informal de conjuntos Si el conjunto A está contenido en el conjunto B, y el conjunto B está contenido en el conjunto C, entonces, tal como se muestra en la figura a la derecha, el conjunto A también está contenido en el conjunto C. ii. prueba en la axiomática no formalizada Por definición, A ⊆ B significa que para todo a, si a ∈ A, entonces a ∈ B. Asimismo, B ⊆ C significa que para todo b, si b ∈ B, entonces b ∈ C. Sea a un elemento de A. De a ∈ A y A ⊆ B se sigue que a ∈ B. A su vez, de a ∈ B y B ⊆ C se sigue que a ∈ C. Por tanto, si a ∈ A, entonces a ∈ C. Como esto último vale para todos los elementos de A, concluimos que A ⊆ C, lcqd. iii. prueba en el cálculo de predicados A continuación mostramos una deducción en el cálculo de predicados de la fórmula x ⊆ z a partir de las hipótesis x ⊆ y e y ⊆ z (es decir, mostramos que x ⊆ y, y ⊆ z x ⊆ z). Con relación a los axiomas lógicos y a las reglas de inferencia, véase el apéndice M.102 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. Deducción formal ∀u(u ∈ x → u ∈ y) ∀u(u ∈ y → u ∈ z ∀u(u ∈ x → u ∈ y) → (u ∈ x → u ∈ y) u∈x→u∈y ∀u(u ∈ y → u ∈ z) → (u ∈ y → u ∈ z) u∈y→u∈z (u ∈ y → u ∈ z) → (u ∈ x → (u ∈ y → u ∈ z)) u ∈ x → (u ∈ y → u ∈ z) (u ∈ x → (u ∈ y → u ∈ z)) → ((u ∈ x → u ∈ y) → u ∈ x → u ∈ z)) (u ∈ x → u ∈ y) → (u ∈ x → u ∈ z) u∈x→u∈z (u ∈ x → u ∈ z) → (∀u(u ∈ x → u ∈ y) → (u ∈ x → u ∈ z)) ∀u(u ∈ x → u ∈ y) → (u ∈ x → u ∈ z) ∀u(u ∈ x → u ∈ y) → ∀u(u ∈ x → u ∈ z) ∀u(u ∈ x → u ∈ z) Análisis de la prueba hip.: x ⊆ y hip.: y ⊆ z Ax. λ10 MP 1, 3 Ax. λ10 MP 2, 5 Ax. λ1 MP 6, 7 Ax. λ2 MP 8, 9 MP 4, 10 Ax. λ1 MP 11, 12 I∀ 13 MP 1, 14. Es decir, x ⊆ z 102 A partir de este momento, supondremos por parte del lector cierta familiaridad con el cálculo de predicados y con la noción de sistema formal, tal como éstas se presentan en los apéndices M y L, respectivamente. 232 4. E L PROGRAMA DE H ILBERT Un análisis comparativo de las tres pruebas arroja los siguientes resultados. En (i), no hay ni siquiera un argumento (o, si se prefiere, la figura es el argumento). En este caso basta con observar el diagrama para convencerse de que lo que se dice es verdad. Obviamente, la representación gráfica es central en este caso, y en ella podemos descubrir, ver, la relación enunciada por la proposición. En este nivel, para establecer un conocimiento suele ser suficiente con mostrar una imagen visual adecuada. En (ii) ya se tiene un argumento más o menos elaborado. Para empezar, se recurre a la definición de la relación “X ⊆ Y ” y al significado de expresiones tales como la palabra “todo”; ya no hay figuras –aunque en ocasiones éstas suelen acompañar a la prueba–, y se supone que el argumento se puede exponer de manera rigurosa dentro del marco de la lógica formal, aunque esto último nunca se hace. En (iii) todos los recursos anteriores han desaparecido. Lo único que se tiene es un despliegue de fórmulas sujeto a reglas muy precisas y susceptibles de un análisis exhaustivo. El que una fórmula pueda figurar en una derivación ya no depende de su aceptación como “cierta” o “evidente”, sino de la observancia de las reglas del juego. Aquí no se permite rechazar un argumento aduciendo que “no es convincente”, pues toda consideración semántica desaparece. Por ejemplo, para verificar que la sucesión de fórmulas anterior es una deducción de x ⊆ z a partir del conjunto Γ = {x ⊆ y, y ⊆ z} no hace falta saber lo que significan estas fórmulas; por el contrario, lo único que se necesita es comprobar que la sucesión cumple con la definición de derivación a partir de Γ, es decir, que cada una de sus fórmulas es un elemento de Λ, un elemento de Γ, o se infiere de fórmulas anteriores con base en alguna de las reglas de inferencia. Esta tarea es rutinaria, y se lleva a cabo examinando la forma de las fórmulas (los pasos 1-15), sin recurrir a su significado, lo cual se expresa en la actualidad diciendo que en principio la revisión la podría realizar un autómata. De algún modo, en este nivel ya no hay lugar para confusiones: la intuición del signo no nos puede engañar a tal grado. En cuanto a la intuición, si bien ésta ya no afecta al sistema en su contenido, sigue estando presente como aquello que nos faculta para reconocer los símbolos, combinarlos, y/o examinar las operaciones que se pueden realizar con ellos. En otras palabras: si bien en una teoría formal la intuición ya no interviene como agente que proporciona verdades y conceptos abstractos, no por ello se le ha eliminado. Desplazada a otro lugar, si se quiere más elemental, ahora interviene como un factor imprescindible en el manejo del formalismo, como un elemento que nos permite reconocer las componentes del sistema y asegurar que las reglas del juego no han sido quebrantadas. Nos hallamos en el terreno de la matemática finitista. Volviendo al tema de la matemática clásica, es claro que Hilbert vio en la formalización un instrumento ideal para lograr una prueba de consistencia finitista. Es más, hacia 1925 ya contaba con un plan específico para tal fin,103 mismo que presentó en 1928 como sigue: 103 Cf. [Hilbert, 1925], p. 107 de la traducción al español. 4.4. E L PROGRAMA 233 En la situación actual [...] el problema de la consistencia es susceptible de un tratamiento preciso. Pues el punto es demostrar que, cuando se introducen elementos ideales, es imposible que obtengamos dos proposiciones lógicamente contradictorias, A y ¬A. Sin embargo [...] la fórmula lógica (A ∧ ¬A) → B se sigue [en el cálculo lógico] de los axiomas para la negación. Si en ella sustituimos [...] la inecuación 0 = 0 en vez de B, obtenemos (A ∧ ¬A) → 0 = 0 y, una vez en posesión de esta fórmula, podemos derivar 0 = 0 a partir de A y ¬A. Por tanto, para probar la consistencia sólo necesitamos mostrar que 0 = 0 no se puede obtener de los axiomas mediante las reglas de inferencia como la última fórmula de una prueba, y por ende que 0 = 0 no es una fórmula derivable.104 Esta es una tarea que en principio se halla en la provincia de la intuición, de la misma manera que en la teoría concreta de los números se halla la tarea de [...] demostrar que es imposible encontrar dos numerales a y b que satisfagan la relación a2 = 2b2 , un problema en el que se debe mostrar que es imposible exhibir dos numerales que tengan cierta propiedad. Similarmente, para nosotros el punto es mostrar que es imposible exhibir una prueba de cierta clase. Pero una prueba formalizada, al igual que un numeral, es un objeto concreto e inspeccionable.105 El ejemplo que Hilbert elige es aleccionador y tiene importancia histórica. Se trata de la demostración, atribuida a lo pitagóricos, de que la diagonal de√un cuadrado no es conmensurable con el lado del cuadrado –en lenguaje actual, que 2 que no se puede escribir como el cociente p/q de dos números enteros–; se trata, también, de la primera demostración de inexistencia de que se tiene noticia y de la primera demostración por √ reducción al absurdo conocida. Podemos reconstruir el argumento como sigue. Si √2 fuera un número racional, entonces habría dos números enteros a y b tales que 2 = a/b. Sin pérdida de generalidad se puede suponer que a y b no tienen factores en común. Elevando al cuadrado se obtiene la ecuación 2 = a2 /b2 , o bien, 2b2 = a2 (). De lo anterior se sigue que a2 es un número par, y por ende que a también es par, pues los 104 [N. del autor] La explicación de por qué la consistencia se sigue de la imposibilidad de derivar la fórmula ¬(0 = 0) es la siguiente: en cualquier sistema formal que incluya una formalización de la lógica clásica (codificada en el cálculo de predicados), son derivables todas las fórmulas de la forma (X ∧ ¬X) → B, que son tautologías. Por tanto, si fuese posible derivar una contradicción A ∧ ¬A, con ésta y la fórmula (A ∧ ¬A) → B se podría derivar, por modus ponens, cualquier fórmula B. Dicho de otra manera: En una teoría inconsistente, todas las fórmulas son derivables. Por tanto, bastaría con demostrar que hay una fórmula B que no es teorema para asegurar la consistencia del sistema. Hilbert, en particular, escoge la fórmula ¬(0 = 0). 105 Hilbert, 1927. Cita tomada de la traducción al inglés, p. 471. En el texto hemos realizado algunos cambios innocuos en la notación y en las fórmulas utilizadas. 234 4. E L PROGRAMA DE H ILBERT números cuadrados son como sus raíces: pares o impares (esto último era sabido por los pitagóricos). Por tanto, se tiene que hay un número c tal que a = 2c. Ahora bien, al sustituir 2c en vez de a en la ecuación () se obtiene la igualdad (2c)2 = 2b2 , es decir, 4c2 = 2b2 o, lo que es lo mismo, 2c2 = b2 . Así, tenemos que b2 es un número par, y por ende que b también es par, lo cual contradice el hecho de que a y b no tienen factores en común. Por tanto, no podemos aceptar la existencia de dos números a y b con √ la propiedad de que 2b2 = a2 , pues ello nos lleva a un absurdo. La conclusión es que 2 no puede ser de la forma a/b. La demostración anterior tiene lugar en la aritmética finitista, y establece una imposibilidad: la de encontrar dos numerales a y b con cierta propiedad.106 Similarmente, Hilbert pretende demostrar la consistencia de la aritmética y de la matemática clásica estableciendo otra imposibilidad: la de construir una prueba de la fórmula ¬(0 = 0), lo cual tiene sentido desde el punto de vista finitista: una prueba formal es un objeto tan concreto como un numeral. Por tanto, bastaría con encontrar un argumento finitista que mostrara la imposibilidad de derivar la fórmula ¬(0 = 0) –una expresión simbólica formada por seis símbolos– para resolver el problema de la consistencia con las herramientas seleccionadas.107 Un ejemplo de prueba finitista de consistencia. Veamos un ejemplo de prueba finitista de consistencia: la del cálculo puro de predicados (donde “puro” significa “sin la igualdad”). Los axiomas del cálculo puro de predicados (CPP) son los axiomas λ1 -λ11 del apéndice M (es decir, los mismos que del cálculo de predicados CP menos los axiomas λ12 y λ13 que tratan con la igualdad); las reglas de inferencia son las mismas: MP, I∀ e I∃ . Hay al respecto una prueba de consistencia basada en consideraciones semánticas. El argumento es el siguiente: 106 Esto significa, entre otras cosas, que las demostraciones por reducción al absurdo sí son admisibles en la aritmética finitista cuando se trata de probar que algo no existe. La razón es que para probar la inexistencia de algo, los métodos de demostración no se pueden limitar a métodos constructivos, pues lo que no existe no se puede mostrar (¡mucho menos construir!). Curiosamente, ésta es quizá la razón por la que los latinos denominaron “demostración” a este procedimiento lógico, pues el prefijo “de” significaría en este caso “alejarse de”: de-mostrar sería alejarse de lo que se muestra, marchar por la vía de la razón. 107 En varios pasajes Hilbert establece un abierto paralelismo entre la aritmética finitista y la teoría de la demostración, como en el siguiente: “Para la teoría intuitiva y concreta [konkret-anschaulich] de los números que hemos expuesto antes son los números los que constituyen lo objetivo y ostensivo, mientras que las demostraciones de los teoremas numéricos caen ya en el ámbito del pensamiento [gedanklich]. En nuestra investigación presente [i. e., en la teoría de la demostración], la demostración misma se convierte en algo concreto y ostensivo, las consideraciones y la argumentación concretas no tienen lugar sino a partir de la demostración.” [Hilbert, 1922. Cita tomada de la traducción al español, p. 53]. Es en este pasaje donde remarca la necesidad de la teoría de la demostración con las siguientes palabras, que ya hemos citado: “Así como el físico examina sus aparatos, el astrónomo sus puntos de referencia y el filósofo lleva a cabo una crítica de la razón, también el matemático se ve obligado a asegurar sus teoremas, y para ello requiere de una teoría de la demostración.” [Hilbert, Ibid.]. En cuanto a la fórmula sugerida, ¬(0 = 0), ésta se podría cambiar por cualquier otra igualdad o desigualdad numérica cuya negación fuera derivable en el formalismo, no habiendo en principio ninguna razón para escogerla precisamente a ella, a no ser su simplicidad. 4.4. E L PROGRAMA 235 1. todos los axiomas del CPP (al igual que los del CP) son fórmulas válidas (verdaderas bajo todas las interpretaciones posibles), 2. las reglas de inferencia MP, I∀ e I∃ preservan la validez, en el sentido de que si las hipótesis de las que se parte son fórmulas válidas, la conclusión también lo es. 3. Combinando (1) y (2) se tiene que todas las fórmulas que se pueden derivar de los axiomas son necesariamente válidas. Dado que una fórmula A y su negación ¬A no pueden ser válidas a la vez, resulta imposible deducir fórmulas contradictorias en el CPP (o en el CP), pues ambas deberían ser válidas. Ahora bien, por muy convincente que nos parezca el argumento anterior, no es ni finitista ni admisible en la teoría de la demostración de Hilbert, pues en él se apela a nociones semánticas como las de verdad, satisfacción y validez que no tienen cabida en ella. No obstante, hay una prueba finitista del mismo hecho. Consideremos la siguiente transformación sintáctica h: dada una fórmula A del cálculo de predicados, h(A) es el resultado de borrar en A todos los términos (variables, constantes y símbolos de función aplicados a términos) y todos los cuantificadores, junto con los paréntesis y comas correspondientes. El resultado es una fórmula del cálculo proposicional. Por ejemplo, Si A es la fórmula ∀xP(x, f (x)) Si A es la fórmula ∀x∃y(R(x, y) ∨ ¬S(x, f (x, y)) Si A es la fórmula ∀x∃yR(x, y) → ∃z∀xR(x, z) entonces h(A) es P entonces h(A) es R ∨ ¬S entonces h(A) es R → R Nótese que la operación h es enteramente sintáctica y sólo toma en consideración los símbolos presentes en las fórmulas. Con un poco de paciencia se puede comprobar que h tiene las siguientes propiedades: 1. h(¬A) = ¬h(A) 2. h(A ∧ B) = h(A) ∧ (B) 3. h(A ∨ B) = h(A) ∨ h(B) 4. h(A → B) = h(A) → h(B) 5. h(A ↔ B) = h(A) ↔ h(B) 6. Si A es un axioma, entonces h(A) es una tautología.108 108 Recuérdese que una tautología es una fórmula proposicional cuyo valor de verdad es “verdadero” cualesquiera que sean los valores de verdad de las letras que la componen. En este contexto la noción de “verdad” considerada no tiene ningún valor semántico, pudiéndose pensar que se trata simplemente de uno entre dos valores posibles (“verdadero”, “falso”) asignables a las letras y a las fórmulas proposicionales conforme al método de las tablas de verdad, que es de naturaleza sintáctica. Para no dar lugar a confusiones, algunos autores prefieren hablar de dos valores posibles, tomados del conjunto V = {0, 1}. 236 4. E L PROGRAMA DE H ILBERT 7. Si h(A) y h(A → B) son tautologías, entonces h(B) también es tautología. 8. Si h(K → A(x)) es tautología, entonces h(K → ∀xA(x)) es una tautología. 9. Si h(A(x) → K) es tautología, entonces h(∃xA(x) → K) es una tautología. De (1)-(5) se infiere (6), es decir, que todos los axiomas del CPP se transforman en tautologías bajo h, y de (7)-(9) se sigue que las reglas de inferencia MP, I∀ e I∃ tienen la siguiente propiedad: Si h transforma las hipótesis en tautologías, también transforma la conclusión en una tautología. Todo lo anterior constituye una prueba finitista de que todas las fórmulas derivables en el CPP se transforman bajo h en tautologías, es decir, hemos probado lo siguiente: Si A es un teorema del CPP, entonces h(A) es una tautología. Ciertamente, si los axiomas se transforman en tautologías y las reglas de inferencia preservan tal condición, entonces cualquier fórmula derivable se transforma bajo h en una tautología. De lo anterior se sigue que el CPP es consistente. Veamos. Para probar que el CPP es no contradictorio basta con mostrar una fórmula de su lenguaje que no sea derivable, lo cual, en este caso, es muy sencillo: la fórmula en cuestión puede ser cualquier fórmula atómica. En efecto, si A es una fórmula atómica del CPP, digamos R(t1 , . . . ,tn ), entonces h(A) es simplemente R, una letra proposicional y, como sabemos, ninguna letra proposicional es tautología. Por tanto, A no es un teorema del CPP, pues de lo contrario su transformada h(A) sería una tautología, lo cual, como es evidente, no es el caso. Otra prueba finitista de una imposibilidad. La demostración anterior es enteramente análoga a la ofrecida por Hilbert y Ackermann con relación a la consistencia del cálculo restringido de predicados sin igualdad.109 En ambos casos la demostración sólo hace referencia a la forma de las fórmulas, al modo en que el procedimiento h las modifica y a los aspectos estructurales de las reglas de inferencia (cómo se alteran o disocian las hipótesis al aplicar las reglas); además, en ningún momento se apela al sentido de las fórmulas, pues todo el argumento se apoya en la evidencia sensible. Estas consideraciones están en la base de la lógica clásica o bivaluada y se pueden extender a sistemas con más de dos valores de verdad, como en el caso de la lógica trivalente intuicionista, o el de las lógicas polivalentes de Lukasiewicz, donde V = {0, 1, . . . , n} para algún n > 1. Además, el procedimiento para verificar si una fórmula proposicional es tautología es enteramente mecánico y finito, y cae por completo dentro de la matemática finitista. 109 El Cálculo restringido de predicados es aquél en el que no figuran símbolos de función, de modo que el conjunto de términos está constituido por las variables y las constantes. Cf. Hilbert y Ackermann, 1928, Cap. III, §9. 4.4. E L PROGRAMA 237 Claro está que alguien podría objetar lo siguiente: “lo que realmente importa, y de ello es un ejemplo la demostración anterior, es que la selección de axiomas para el cálculo puro de predicados es correcta con relación a la noción semántica de validez, lo cual coloca a esta noción en un primer plano”. No obstante, dos podrían ser las respuestas de un formalista. La primera, estamos convencidos, la daría Jacques Herbrand: “En el sentido que Ud. menciona, la demostración anterior lo único que nos hace ver es que la noción de prueba formal en el CPP es el sucedáneo constructivo de la más bien vaga, imprecisa e incluso prematemática noción de validez, que ahora podemos lanzar al cesto de la basura”. Hilbert en cambio podría responder en el siguiente tenor: “De ninguna manera. Lo que hemos hecho no ha sido resolver un problema lógico, sino un problema de combinatoria: dado un sistema simbólico gobernado por tales y cuales reglas, ¿es posible producir en él ciertas combinaciones específicas de signos? Como Ud. verá, no hay nada detrás de nuestros signos (esto último, acompañado quizá por una sonrisa irónica). La importancia que Ud. atribuye al CPP es, en todo caso, ajena al sistema.” Ciertamente, uno de los propósitos de la formalización es despojar a los símbolos de su función “evocativa”, obligando al pensamiento a detenerse en ellos en vez de acceder, por su intermedio, a la cosa simbolizada. Esta idea la representamos gráficamente en la siguiente figura, en la que se da a entender que la interpretación de los símbolos ℵ0 y 2ℵ0 ha sido postergada para sólo concentrar la atención en ellos mismos. Figura 4.2. Con la formalización, a los símbolos se les retira la función designativa que les es propia, a fin de tomarlos como objetos últimos. Esta idea marcha acorde con el espíritu del programa, según el cual no se debe recurrir a nada externo al sistema. En este sentido, para fijar las condiciones exactas en que se habría de dar la prueba de consistencia sólo nos falta precisar la relación entre los distintos actores que habrían de participar en ella: la matemática informal, la matemática formalizada y la metamatemática, que se encargaría de la prueba. De esto nos ocuparemos en el siguiente apartado, en el que habremos de penetrar en el sentido último del programa y señalar algunos problemas que con el tiempo se fueron incorporando al mismo. Asistiremos también a la ceremonia de fundación de la metamatemática, que en su momento Hilbert identificó con la teoría de la demostración110 . 110 Esta identificación perdió toda su fuerza con el paso del tiempo. En la actualidad, la teoría de la 238 4. E L PROGRAMA DE H ILBERT 4.4.3. La teoría de la demostración La labor de Hilbert en torno a los fundamentos tuvo considerable importancia en el desarrollo de la lógica matemática, no tanto por los resultados obtenidos, sino por los métodos de investigación que introdujo. Si hubiéramos de señalar las figuras mayor peso en este dominio, mal haríamos en no volver la mirada hacia Hilbert, pues sin sus ideas la lógica moderna difícilmente habría alcanzado los niveles que ostenta.111 Hilbert no sólo introdujo los formalismos, sino que planteó diversas cuestiones que siguen presentes como temas de investigación (problemas de consistencia, completud y decidibilidad) que con anterioridad habían ocupado si acaso un lugar marginal, y que él colocó al centro de su programa. Incluso la moderna teoría de modelos, cuyo origen está vinculado a los Grundlagen de 1899, se sirve en la actualidad de los métodos y conceptos de la teoría de la demostración, que de alguna manera han irrumpido en toda la lógica contemporánea. La noción de formalismo debe su importancia a que se le considera un sustituto adecuado de las teorías matemáticas cuando se trata de investigar sus propiedades lógicas. A partir de cierto momento en su desarrollo, cualquier teoría matemática se puede traducir a un formalismo que, de momento, la representa con un alto grado de fidelidad. El prodigio de la formalización es que convierte cada teoría en símbolos, y a los símbolos en una petrificación de la teoría. De esta manera la teoría deviene en un objeto concreto, susceptible de un examen preciso en todas sus partes. Esta cualidad se ha subrayado en la literatura de diversas maneras, con distintas metáforas: mosaico de fórmulas expuestas a la mirada, juego de marcas sin sentido escritas en el papel, imagen gráfica de nuestras teorías matemáticas. Fue justamente este doble cometido lo que atrajo a Hilbert. Una formalización es dos cosas a la vez: imagen de nuestro pensamiento y reunión de signos asignificativos que se combinan y disocian según reglas establecidas: El juego de fórmulas que Brouwer tanto desprecia tiene, además de su valor matemático, una significancia filosófica general muy importante. Pues este juego de fórmulas se lleva a cabo de acuerdo con ciertas reglas definidas, en las que la técnica de nuestro pensamiento se expresa. Estas reglas forman un sistema cerrado que puede ser descubierto y establecido definitivamente. La idea fundamental de mi teoría de la demostración no es otra que describir la actividad de nuestro entendimiento, hacer un protocolo de las reglas acorde a las cuales nuestro pensamiento procede en realidad. El pensamiento, así demostración desborda con mucho las restricciones impuestas por Hilbert, y constituye un área muy activa de la lógica matemática, en la que se examinan numerosas cuestiones relativas a la noción sintáctica de prueba, ya sin ninguna relación con el problema de los fundamentos (o, al menos, no en el sentido de Hilbert), y en la que los métodos de prueba se extienden hasta alcanzar los de la matemática clásica en general. 111 Por ejemplo, los teoremas de Gödel difícilmente se habrían dado sin la pertinaz insistencia de Hilbert en convertir las teorías matemáticas en formalismos carentes de todo contenido. 4.4. E L PROGRAMA 239 sucede, guarda un estrecho paralelismo con el habla y la escritura: formamos enunciados y los colocamos uno tras otro.112 Para Hilbert el valor de la formalización radica, entonces, en que permite expresar de manera uniforme todo el pensamiento contenido en la ciencia matemática y desarrollarlo de modo que, al mismo tiempo, se aclaren los vínculos entre los enunciados particulares. Desde su punto de vista las fórmulas no son meras formas vacías: también son imágenes de pensamientos; las pruebas, no son tan sólo sucesiones inertes, sino la seriación que se oculta detrás de nuestros argumentos: “Los axiomas y teoremas, esto es, las fórmulas que surgen en estas transformaciones, son las representaciones [Abbilder] de las ideas que constituyen los procedimientos utilizados hasta ahora en las matemáticas, sin constituir ellos mismos verdades en un sentido absoluto.”113 Si seguimos el pensamiento de Hilbert desde los Grundlagen der Geometrie, hallaremos la razón por la cual su proyecto axiomático termina, necesariamente, en la formalización. Si bien todas las teorías axiomáticas ya manifiestan un orden, en ellas la sutil estructura demostrativa no es del todo explícita, pues aún falta precisar la noción de demostración.114 Y el único camino que encuentra Hilbert para fijar esta última noción es el de la formalización: el canon de la lógica se ha de expresar bajo la forma de reglas de transformación que actúan directamente sobre los signos y sus combinaciones. Hilbert cree que sólo así se puede tener un pleno conocimiento del modo en que procede el pensamiento matemático. Dice al respecto: “Si alguna totalidad de observaciones y fenómenos merece ser el objeto de una investigación seria y detallada, es ésta –pues, después de todo, es parte de la tarea científica liberarnos de la arbitrariedad, de los sentimientos y los hábitos y protegernos del subjetivismo que ya se hizo sentir en el punto de vista de Kronecker y que, así me parece, encuentra su culminación en el intuicionismo.”115 La matemática ha de sustentarse sobre una base 112 Hilbert, 1927. Cita tomada de la traducción al inglés, p. 475. 1923. Cita tomada de la traducción al español, p. 65. 114 Esta situación se observa con toda claridad en el caso de la teoría de los números. En un principio, esta teoría se desarrolla en contacto con nociones e imágenes geométricas e intuiciones sensibles (v. gr., números figurados, los números reales como puntos de una línea recta, los números naturales como numerales, etc.), y no es sino posteriormente que se transforma en una teoría axiomática. No obstante, con ello no se logra el pleno conocimiento de la estructura demostrativa de la teoría, pues el análisis lógico lo único que puede producir es una trama de conceptos, en la que la estructura deductiva aún se halla sujeta a consideraciones semánticas y/o subjetivas. Por otra parte, cabe señalar que no todas las teorías matemáticas nacen de la manera recién indicada. Por ejemplo, la teoría de grupos surge de la reflexión en torno a las similitudes estructurales entre diversos dominios de la matemática. No obstante, los materiales sobre los que se forjan sus conceptos se pueden considerar como materiales empíricos que la nueva teoría subsume en ellos. Se trata de una construcción teórica en la que los objetos de origen son a su vez conceptos (raíces de ecuaciones, permutaciones, transformaciones, operaciones con matrices, etc.) que se “conocen” a través de otras teorías y sobre los que se forma un nuevo entramado conceptual a través del contacto directo con ellos. Aquí también, una vez acumulados los hechos de esta esfera particular del saber, éstos se ordenan con apego al método axiomático. 115 Hilbert, 1927. Cita tomada de la traducción al inglés, p. 475. 113 Hilbert, 240 4. E L PROGRAMA DE H ILBERT racional, igualmente alejada del idealismo, del subjetivismo, del realismo conceptual y de cualquier otra consideración ajena a ella misma.116 Es aquí donde entra en escena la teoría de la demostración, pues es a través de ella que el entendimiento matemático pone a prueba las leyes de su propio pensamiento.117 El anterior punto de vista se consolidaría tras superar un último escollo: la prueba de consistencia de la aritmética. Dice al respecto: “es la prueba de consistencia la que determina el alcance efectivo de mi teoría de la demostración y constituye su núcleo.”118 Mas en esto había que evitar cualquier confusión: una prueba de no contradicción es una prueba acerca de las pruebas formales, un teorema sobre otros teoremas. Para distinguir los distintos niveles en que se mueve la demostración (el formal y el intuitivo), Hilbert acuñó el término ‘metamatemáticas’, dando a entender que se trata de una teoría matemática acerca de las teorías matemáticas formalizadas, es decir, una teoría que trata con las propiedades de los formalismos, sus demostraciones y las expresiones que figuran en ellos.119 La siguiente es el acta de fundación de esta nueva teoría: A la matemática real [eigentlich] así formalizada se añade una especie de nueva matemática, una metamatemática, necesaria para salvaguardar a aquélla y en la que, en contraposición con los métodos puramente formales de inferencia de la matemática real, la inferencia concreta es utilizada, pero únicamente para las pruebas de consistencia de los axiomas. La metamatemática trabaja con las demostraciones de la matemática real y, en realidad, éstas constituyen su objeto de investigación. Las matemáticas en general se desarrollan entonces por medio de la transición constante en dos sentidos: por una parte, obteniendo a partir de los axiomas nuevas fórmulas demostrables por medio de la inferencia formal; y por la otra, añadiendo nuevos axiomas junto con la prueba de su consistencia por medio de inferencias concretas.120 116 No podemos prescindir en este punto de la cita que hicimos al final de la sección 4.2.4 acerca de la matemática como ciencia sin presuposiciones, y que rogamos al lector la lea de nuevo. 117 La axiomatización de una teoría constituye un paso en la dirección de la abstracción. Podría parecer entonces que la formalización es un segundo paso en la misma dirección. No obstante, lo que esta última operación produce es un objeto sintáctico que se puede examinar directamente, con base en nociones susceptibles de cobrar vida en el ámbito de la sensibilidad. 118 Hilbert, op. cit., p. 479. 119 Metamatemática: más allá o después de la matemática. En la expresión utilizada, el prefijo “meta” indica la necesidad de separar los razonamientos matemáticos (representados por las pruebas formales) de los razonamientos matemáticos acerca de los razonamientos matemáticos. Esta distinción fue muy importante para Hilbert, pues su inadvertencia ya había dado lugar a paradojas (entre las que se hallan, por ejemplo, las de Richard y Berry). 120 Hilbert, 1922a. Cita tomada de la traducción al español, p. 65. La metamatemática tiene como cometido examinar la estructura deductiva de las teorías formalizadas, sirviéndose de métodos deductivos tan sencillos y seguros que nadie pueda dudar de su corrección. Así, por una curiosa inversión de papeles, sólo en la metamatemática se ejerce el pensamiento efectivo, capaz de procurar una verdad, pues sólo ella posee un genuino objeto de estudio: los signos y sus agrupaciones. 4.4. E L PROGRAMA 241 La empresa sugerida por Hilbert parte de la suposición de que toda teoría se puede formalizar plenamente, es decir, se puede equiparar con su formalización. Esto supone que toda proposición “demostrable” en la primera se traduce en una fórmula derivable en la segunda, y viceversa, lo cual no puede ser objeto de una demostración rigurosa: la noción informal de prueba no es susceptible de una definición estricta. En todo caso, lo que Hilbert pretende es convertir el concepto de prueba formal en un sucedáneo constructivo de la noción informal de prueba. La seguridad en la empresa era tal que Hilbert llegó a imaginar que la metamatemática formaría una especie de protocolo que regiría la ceremonia de fundamentación de las teorías matemáticas. En cada caso la ceremonia sería muy sencilla y consistiría en probar la consistencia de la formalización de la teoría. A continuación se presenta un esquema de la prueba de consistencia absoluta de la matemática clásica.121 Hacia el final de los años veinte todo parecía indicar que la teoría de la demostración se vería coronada por el éxito: los conceptos estaban a punto, las herramientas relucientes, los distintos actores dispuestos en su lugar; las teorías formalizadas parecían contener las teorías informales y caían directamente en el ámbito de la intuición sensible, el problema de la consistencia se había formulado en términos puramente combinatorios y la metamatemática parecía capaz de producir la prueba anhelada en el caso de la matemática clásica. En apariencia todo encajaba; la solución al problema de los fundamentos parecía cuestión de tiempo. Incluso se contaba con algunos avances, aunque incipientes: hacia 1927 ya se conocían pruebas de consistencia finitista para algunos fragmentos de la aritmética de Peano.122 El tono era triunfalista. Basten algunas citas al respecto: “Estoy convencido de haber logrado lo que me había propuesto y había adelantado con relación a la teoría de la demostración: la eliminación definitiva del problema de los fundamentos de las matemáticas como tal.”123 121 El diagrama presenta de manera esquemática el lugar que ocupa cada uno de los distintos actores que intervienen en la teoría de la demostración: la teoría cuya consistencia se quiere probar (en este caso la matemática clásica), la teoría formalizada y la metamatemática, esta última con el cometido de proporcionar una prueba finitista de consistencia. 122 Las pruebas se dieron a conocer en [Ackermann, 1924] y [von Neumann, 1927]. Los fragmentos en cuestión eran el resultado de restringir el esquema inductivo a fórmulas no muy complejas, en la que la estructura cuantificacional era muy simple. 123 Hilbert, 1927. Cita tomada de la traducción al español, p. 135. 242 4. E L PROGRAMA DE H ILBERT “Mediante este nuevo fundamento de las matemáticas, que conviene denominar teoría de la demostración, me considero en condiciones de eliminar definitivamente la cuestión de los fundamentos y transformar toda proposición matemática en una fórmula que se puede exhibir en concreto y derivar rigurosamente, lo cual traslada todo el nudo de problemas al dominio de la matemática pura.”124 “Podemos decir entonces que la teoría de la demostración, cuyos rasgos principales acabamos de bosquejar, no sólo se encuentra en condiciones de dar una base firme y segura a las matemáticas, sino que también abre una novedosa vía para abordar los problemas generales de carácter fundamental que caen dentro del dominio de nuestra disciplina y a los que antes no podíamos abocarnos.”125 Como se colige de la última cita, la confianza depositada en los medios llevó a Hilbert a imaginar que la teoría de la demostración resolvería muchos otros problemas relacionados con la lógica y la matemática. Dos de ellos llaman la atención: el problema del continuo y el problema de la decisión. La solución del primero sería una prueba de la fecundidad de los métodos utilizados; la solución del segundo una prueba del alcance de los métodos sintácticos. Históricamente, estos problemas ocuparon un lugar especial en el desarrollo de la lógica y fueron el motor de muchas investigaciones. Para los fines que perseguía Hilbert, el último de ellos tenía una mayor significación en la medida que serviría de apoyo a la creencia que lo acompañó durante toda su vida y de la que ya hemos hablado: la de que todo problema matemático es susceptible de una solución precisa. De ello nos ocuparemos en breve. En cuanto al problema del continuo, de éste sólo haremos un breve comentario. Para Hilbert, una prueba de la eficacia de la teoría de la demostración sería resolver un problema para el que no había sido proyectada. Para ello eligió el primer problema de su famosa lista de 1900, el relativo al cardinal del continuo.126 Dice al respecto: “La prueba definitiva para la evaluación de cualquier teoría nueva la constituye su capacidad para resolver problemas planteados antes de que ella existiera, problemas cuya solución no formaba parte de las razones específicas para crearla. ‘Por sus frutos los conoceréis’ es también un principio válido para las teorías.”,127 a lo que más adelante añade: “La solución del problema del continuo es algo que puede realizarse con la teoría que hemos desarrollado. De hecho, la prueba de que todo problema matemático tiene una solución representa precisamente el primer paso de importancia en esta dirección.”128 Al comentario anterior siguió un intento por demostrar la hipótesis del continuo. Según Hilbert, la prueba quedaría lista al reformular y probar de manera finitista dos lemas que enuncia sin demostración. Obviamente, la demostración quedó por siempre inconclusa 124 Hilbert, 1928, Cita tomada de la traducción al francés, p. 179. 1925. Cita tomada de la traducción al español, p. 108. 126 Hilbert se refiere a este problema como “El problema de Cantor relativo al número cardinal del continuo”. En la sección 2.6.4 el lector hallará una amplia referencia al problema del continuo. 127 Hilbert, op. cit., pp. 108-109. 128 Hilbert, ibid. 125 Hilbert, 4.4. E L PROGRAMA 243 y ahora sabemos por qué: la hipótesis del continuo es independiente de los axiomas del Zermelo-Fraenkel, de la misma manera en que el quinto postulado de Euclides lo es de los otros cuatro postulados.129 4.4.4. Las cuestiones de la resolubilidad (parte 2), la completud y el problema de la decisión Como ya hemos visto, hacia 1908 Brouwer retó a Hilbert a que ofreciera una prueba de la inexistencia de problemas matemáticos irresolubles. Tras un silencio que duró más de una década, en los años veinte Hilbert vio en la teoría de la demostración la herramienta adecuada para abordar esta cuestión en forma rigurosa. Dentro del contexto del programa, el problema de la resolubilidad, planteado inicialmente con cierta vaguedad y más cercano a la especulación filosófica que a la matemática, se transformó en un tema de investigación formal. Ahora su estudio pasaba por los siguientes conceptos: cálculo lógico (una noción semejante a la de sistema formal), prueba formal, consistencia y completud. Dice Hilbert: “Ciertamente, la teoría de la demostración no puede proporcionar un método general para resolver todos los problemas matemáticos. No existe algo de ese tipo. Sin embargo, lo que sí cae dentro del campo de acción de nuestra teoría es la prueba misma de la consistencia de la suposición del carácter resoluble de todo problema matemático.”130 Veamos qué tenía en mente Hilbert al momento de relacionar entre sí las nociones de consistencia y resolubilidad. Supongamos que se cuenta con un procedimiento para decidir si una fórmula A es consistente con los axiomas de una teoría formal ℑ. Ahora, si al aplicarlo a una fórmula de la forma ∃xp(x) descubrimos que sí lo es, tendremos una prueba metamatemática de la posibilidad de resolver el problema. Esto nos colocaría frente a una disyuntiva: o bien ∃xp(x) es derivable de los axiomas, o bien 129 Esto fue probado por Gödel (compatibilidad: 1938) y Paul Cohen (independencia: 1963). 1925, p. 108. En nuestra opinión, por “la suposición del carácter resoluble de todo problema matemático” debemos entender en este caso el principio del tercero excluido. Este principio establece que toda proposición matemática es verdadera o falsa. Por tanto, asumirlo respalda la idea de que todo problema tiene respuesta. Una dificultad respecto a este principio es que su validez no se puede afirmar sin más con relación a las totalidades infinitas. Piénsese, por ejemplo, en un enunciado existencial de la forma ∃xA(x) relativo a los enteros positivos, donde A(x) es un predicado decidible. La única manera de validar el principio en esta circunstancia sería a través de la exhibición de un caso favorable, i. e., de una n tal que A(n), o de una prueba que mostrara que para cada n, ¬A(n). En un dominio finito esto siempre se puede lograr a través de la revisión exhaustiva de todos los casos. No obstante, tratándose de los enteros positivos resulta imposible llevar a cabo una tarea de esta naturaleza a fin de llegar a una conclusión negativa. Por tanto, con relación a los conjuntos infinitos nada garantiza la validez incondicional del principio del tercero excluido, el cual tiene el rango de una noción ideal y como tal se le debe justificar. En otras palabras, Hilbert ve en el principio del tercero excluido una idea regulativa en el sentido de Kant –una hipótesis acerca del mundo y las cosas mediante la cual damos unidad y simplicidad a nuestro pensamiento– cuya incorporación debemos justificar. Dicha justificación consistiría en una prueba de consistencia, lo cual cae dentro del campo de acción de la teoría de la demostración, tal como lo afirma Hilbert en el pasaje citado. 130 Hilbert, 244 4. E L PROGRAMA DE H ILBERT es independiente de ellos. No obstante, la alternativa anterior también se puede resolver: ∃xp(x) es derivable a partir de los axiomas de ℑ si y sólo sí ¬∃xp(x) es inconsistente con ellos, y esto último lo podríamos decidir con base en tal procedimiento. Es más, en el caso en que ∃xp(x) resulte independiente de los axiomas de ℑ, de modo que no sea posible probar la fórmula ¬∃xp(x) o hallar un contraejemplo para ∃xp(x), cualquiera de estas fórmulas se puede añadir como axioma y postular, con ello, la existencia o la no existencia de una solución para el problema p(x) sin incurrir en ningún peligro.131 Si, por el contrario, la fórmula ∃xA(x) no fuera compatible con los axiomas, entonces se tendría una prueba formal de que el problema no tiene solución, pues al no ser la fórmula consistente con los axiomas, su negación, la fórmula ¬∃xA(x), sería derivable de ellos, con lo que se tendría una prueba de la irresolubilidad del problema.132 Es así que una prueba de consistencia para ∃xp(x) sería, para Hilbert, una manera de resolver el problema expresado por la fórmula. Hay dos observaciones: 1. Planteado de esta manera, el problema de la resolubilidad de todo problema matemático se fragmenta, debiéndose considerar en el contexto de cada teoría específica. Por otra parte, esta fragmentación reduce el problema a proporciones manejables. Cuando Hilbert abordó esta cuestión en 1900 pasó por alto que la irresolubilidad no es una cuestión absoluta, sino relativa a los axiomas adoptados. Esta noción tan abierta de resolubilidad –es decir, resolubilidad no a través de medios específicos sino a través de cualesquiera medios imaginables– es, por decir lo menos, cuestionable, y parece no tener ningún sentido.133 2. En el contexto de la teoría de la demostración, la cuestión de la resolubilidad de todo problema matemático es una cuestión precisa con relación a cada teoría específica. De esta manera, incluso ante la imposibilidad de precisar un método general para resolver todos los problemas matemáticos, Hilbert está preparado para abordar la cuestión caso por caso, investigando la estructura lógica de cada teoría. En cada situación la cuestión de la resolubilidad se convierte en un problema combinatorio relativo al sistema considerado, es decir, en un problema matemático. De esta manera Hilbert busca dar fin a una disputa filosófica (la de la resolubilidad de todo problema matemático) no a través de la discusión verbal, sino haciendo matemáticas. Se trata, en fin, de la ’matematización’ un problema filosófico. 131 Aquí entra en juego el “principio creativo” de Hilbert, según el cual nosotros creamos los objetos matemáticos mediante axiomas. Al respecto, véanse la correspondencia Hilbert-Frege en (Frege, 1980) y los comentarios de Michael Detlefsen en “FOM: Hilbert and solvability, etc.”, op. cit. 132 En efecto, en este caso se tiene que la fórmula ¬∃xA(x) es derivable a partir de los axiomas. La base de todo esto es el siguiente resultado, válido en el cálculo de predicados: si un enunciado B es incompatible con un conjunto de enunciados K, entonces ¬B es deducible a partir de K, es decir, K CP ¬B. Cabe señalar que detrás de este resultado se halla la utilización del principio del tercero excluido dentro del cálculo de predicados, una razón más para que Hilbert se aferrara a él. 133 Al respecto, véase Gödel, 1995, p. 65, nota al pie 4. 4.4. E L PROGRAMA 245 Ahora bien, toda la argumentación anterior está basada en la supuesta existencia de un procedimiento efectivo para determinar si un enunciado cualquiera es compatible o no con los axiomas de una teoría. Hacia 1928 nada de esto se había logrado, salvo en los casos más simples. Fue entonces que Hilbert introdujo dos nociones de enorme interés para la lógica matemática contemporánea: la de completud de los axiomas y la de decidibilidad de una teoría. Su posesión por parte de una teoría sería el complemento ideal de la propiedad de ser consistente, a la vez que garantizaría la resolubilidad de todo problema matemático perteneciente a dicho dominio.134 Veamos. La consistencia de una teoría formal establece que a partir de los axiomas y siguiendo las reglas de inferencia, nunca se llegará a dos fórmulas una de las cuales es la negación de la otra. La completud sintáctica es el complemento perfecto de esta propiedad: un sistema formal es sintácticamente completo cuando para todo enunciado A se cumple que o él o su negación ¬A es derivable en el sistema. Claro está que el ideal de la formalización es un formalismo consistente y completo, pues en tal caso el dilema “de los enunciados A y ¬A, ¿con cuál de ellos nos debemos quedar?” se puede resolver por inferencia lógica. Y así como la consistencia evita que ambos enunciados A y ¬A sean derivables, la completud garantiza que se puede probar al menos uno de ellos. En tal caso, el sistema llevaría a una decisión para cada problema pertinente y la investigación perdería importancia: bastaría con señalar cuál de las fórmulas A o ¬A es inconsistente con los axiomas para saber que la otra es derivable en el sistema. Se puede argüir que en el caso de la aritmética elemental Hilbert ya cuenta con la prueba de que el sistema de Peano es categórico y, por tanto, completo.135 No obstante, la demostración de tal hecho no es finitista –en ella se utilizan nociones provenientes de la teoría de conjuntos– y el sistema no está formulado en el lenguaje de la lógica de predicados, sino en el de los conjuntos. En vista de lo anterior, Hilbert se vio en la necesidad de reemplazar tal teoría de Peano con una de primer orden (véase al respecto el apéndice O) e intentar una prueba finitista de la siguiente proposición: Si a los axiomas de la aritmética se añade una fórmula (aritmética) que no es derivable en dicho sistema, entonces se puede derivar una contradicción en el sistema extendido.136 134 El lector hallará referencias explícitas a esta cuestión en (Hilbert, 1917, p. 32 de la trad. al español; Hilbert, 1925, p. 108 de la trad. al español; Hilbert, 1927, p. 473 de la trad. al inglés y Hilbert, 1930, p. 1165 de la trad. al inglés). 135 Un sistema categórico es lo máximo a lo que se puede aspirar al formalizar una teoría. Lo que afirma la categoricidad es que todos los modelos de la teoría son isomorfos entre sí, es decir, que desde un punto de vista estructural todas sus interpretaciones son indistinguibles entre sí, difiriendo entre ellas sólo en la terminología y la notación que empleamos. Se sabe que toda teoría categórica es completa, y que lo recíproco es falso. En cuanto a las teorías de primer orden (es decir, cuyo lenguaje es el de la lógica de predicados de primer orden), sabemos, por el teorema de Löwenheim-Skolem, que ninguna teoría que tiene un modelo infinito es categórica. Al respecto, véase [Mendelson, 1979]. 136 Cf. Hilbert, 1928. 246 4. E L PROGRAMA DE H ILBERT La ventaja de esta formulación es que sólo hace referencia a las pruebas formales del sistema, no a sus interpretaciones. Detrás de la aparente sencillez del problema de la completud se oculta un ideal: el de determinar (mediante la aplicación de un algoritmo), para cada problema aritmético, si éste tiene solución, pues, como acabamos de ver, demostrar la proposición anterior equivaldría a demostrar que los axiomas de la aritmética constituyen un sistema completo. Otra ventaja de esta formulación es que pone en claro que la derivabilidad de una fórmula en un sistema sintácticamente completo es equivalente a su consistencia con los axiomas, pues si ésta no los contradice y el sistema es completo, la fórmula es derivable. Por tanto, cuando estas condiciones se cumplen, la noción de verdad se puede reemplazar con la noción de consistencia, conforme a las expectativas que Hilbert se había trazado. Si a esto añadimos que Hilbert estaba seguro de poder construir un método finitista para verificar si un sistema de enunciados es o no consistente, nos daremos cuenta de la importancia que tiene en su proyecto el problema de la completud sintáctica de los axiomas aritméticos. La construcción de una teoría formal con tales características sería el triunfo de la postura radical a la que Hilbert llegó a finales de los años veinte. No obstante, ahora sabemos que un formalismo completo que abarque todas las verdades aritméticas –y aquí nos disculpamos con Hilbert por utilizar la noción de verdad, tan prohibida en su epistemología– es imposible de hallar.137 Veamos ahora un importante problema relacionado con lo anterior. El problema de la decisión. Resolver este problema fue quizá el más ambicioso de todos los planes ideados por Hilbert, una ilusión nacida de una creencia: la de haber descubierto algo muy cercano a la characteristica universalis (el lenguaje de la lógica de predicados) y al calculus ratiocinator (el cálculo de predicados) que soñara Leibniz,138 situación que empalma muy bien con su convicción de que todo problema matemático es resoluble.139 Hilbert relacionó rápidamente la cuestión de la completud de los axiomas de la aritmética con la cuestión de la completud del cálculo de predicados,140 que en principio es un problema de naturaleza lógica. En este caso con el término “completud” se hace referencia, no a una cuestión sintáctica, sino semántica, que podemos formular así: 137 De eso trata el primer teorema de incompletud de Gödel, que pronto veremos. un célebre manuscrito, Leibniz se refiere a la creación de una lingua philosophica y sobre de ella un calculus racionator que proporcionaría un método cuasi-mecánico de extracción de conclusiones, llegando incluso a imaginar que, una vez elaborado ese lenguaje, quienes desearan solucionar cualquier controversia sólo tendrían que tomar el lápiz y decir: ¡calculemos!. Cf. Gerhardt, vol. 7, p. 200. 139 Como veremos, esta creencia fue puesta en duda con los teoremas de Gödel y otros resultados, que de alguna manera imponen un límite a lo que se puede alcanzar con las teorías formales. 140 En [Hilbert, 1928], Hilbert se refiere al cálculo de predicados como el sistema de reglas lógicas, mientras que en [Hilbert y Ackermann, 1928] se utiliza la expresión cálculo funcional que, en la segunda edición de 1937, Ackermann cambia por cálculo de predicados, siguiendo el uso general. 138 En 4.4. E L PROGRAMA 247 Si A es una fórmula del cálculo de predicados que es válida, entonces A es derivable en el sistema.141 Cuando Hilbert abordó esta cuestión en 1928 se trataba de un problema abierto.142 No obstante, aun sin saber que la respuesta sería favorable, Hilbert se percató de que la completud referida no tenía el mismo alcance que la completud sintáctica y que, a diferencia de ésta, no garantizaba de suyo la resolubilidad en principio de todo problema matemático en el sentido ya señalado. Fue por ello que planteó el problema de la decisión [Entscheidungsproblem]: ¿Habrá un método efectivo para determinar si una fórmula cerrada de la lógica de predicados de primer orden es derivable en el sistema? El vínculo de este problema con el de la resolubilidad de todo problema matemático es el siguiente. Como sabemos –y sabía Hilbert–, si una fórmula A es derivable en el cálculo de predicados a partir de un conjunto K de enunciados, entonces hay un conjunto de fórmulas B1 , B2 , . . ., Bn pertenecientes a K con la propiedad de que la fórmula (B1 ∧ B2 ∧ . . . ∧ Bn ) → A es válida (digamos que las fórmulas B1 , B2 , . . ., Bn son aquéllas que participan efectivamente en la derivación de A), y recíprocamente.143 Se tiene, pues, que los problemas de validez y deducibilidad formal a partir de axiomas están relacionados entre sí,144 y el problema de la decisión se puede expresar también de la siguiente manera: ¿Habrá un método efectivo para determinar si una fórmula cerrada de la lógica de predicados de primer orden es válida?145 141 Válida significa verdadera en todas las interpretaciones posibles. problema fue resuelto por Gödel en 1930, y la respuesta fue favorable: todas las fórmulas válidas del cálculo de predicados son derivables en el sistema. Al combinar este resultado con el hecho de que toda fórmula derivable en el cálculo de predicados es válida, resulta lo siguiente: Una fórmula A es un teorema del cálculo de predicados (CP) si y sólo si es válida. Se tiene, pues, un cálculo completo con relación a lo noción de validez, mas no completo en el sentido de que entre una fórmula y su negación, alguna de las dos es derivable. Por ejemplo, dadas una fórmula atómica P(a) y su negación ¬P(a), ninguna de ellas es derivable en el CP, pues ninguna de las dos es válida. 143 Esto lo podemos expresar así: K CP A si y sólo si existe {B1 , B2 , . . . , Bn } ⊆ K tal que |= (B1 ∧ B2 ∧ . . . ∧ Bn ) → A. 144 En [Hilbert y Ackermann, 1928] los autores no sólo se refieren a la validez, sino a la satisfacibilidad de las fórmulas, cuestión que aquí no tocaremos dado que nuestro interés es tan sólo mostrar la clase de problemas que Hilbert intente resolver con la teoría de la demostración. 145 Tras los avances de la lógica matemática en los años treinta, y siguiendo a Hilbert y Ackermann en la segunda edición de su libro Grundzüge der Theoretischen Logik, esto se puede expresar como sigue: ¿existe un procedimiento recursivo para las fórmulas individuales que asigne a una fórmula el valor 1 si ésta es válida y el valor 0 si no lo es?. Cf. [Church, 1936], [Turing, 1937] y la segunda edición de [Hilbert y Ackermann, 1928]. Esta última formulación tiene la ventaja de que en ella el tema de la decidibilidad se relaciona con el de las funciones recursivas, las cuales desempeñan un importante papel en la demostración de los teoremas de incompletud de Gödel y en la lógica moderna en general. 142 El 248 4. E L PROGRAMA DE H ILBERT Cuando Hilbert formuló este problema, el tono del programa ya era otro: la solución del problema de la decisión sería la guirnalda que coronaría el análisis de las reglas con que se conduce la razón matemática. Eran los años de la esperanza y la fe reduccionista, que se resumen muy bien en el siguiente pasaje, más bien extenso, que ilustra a la perfección cómo llegó a creer que su programa era la panacea: Mi exposición de hoy muestra cuántos problemas aguardan solución [Hilbert se refiere a diversos problemas relativos a la completud, decisión, consistencia, etc. que recién ha enumerado]. Mas sobre el plan de la teoría general, incluso la más pequeña traza de ambigüedad es imposible: toda cuestión que se plantea encuentra, en el cuadro de la teoría de la demostración que he esbozado, una respuesta dotada de la precisión y la univocidad matemáticas. Las aseveraciones correspondientes son a partir de ahora demostrables de manera absolutamente segura y puramente matemática mediante los resultados ya obtenidos, y por tanto no están sujetas a impugnación. Todo aquel que pretenda refutarme debe, según una costumbre que ha prevalecido desde siempre en las matemáticas y que lo continuará haciendo en el porvenir, mostrarme exactamente en qué me equivoco. [...] Creo que mi teoría de la demostración nos proporciona además un servicio de orden más general. ¿Qué sería de la verdad de nuestro saber, qué sería de la existencia y del progreso de las ciencias si no hubiera una verdad segura en las matemáticas? Es frecuente en nuestros días encontrar hasta en las publicaciones especializadas o en las conferencias públicas una expresión de duda y desánimo en cuanto a la ciencia; he ahí una especie de ocultismo que considero nefasto. La teoría de la demostración hace imposible esta actitud y nos otorga la certeza de que el entendimiento matemático no conoce límites y es capaz de poner a prueba las leyes de su propio pensamiento. Cantor decía que la esencia de las matemáticas reside en su libertad; frente a los incrédulos y los pusilánimes yo quisiera añadir: en la matemática no hay lugar para el ignorabimus,146 siempre podemos hallar respuesta a cualquier cuestión a condición de que tenga sentido, y lo que fue sin duda el presentimiento de Aristóteles se confirma: que nuestra inteligencia no se entrega a artificios misteriosos, sino que procede únicamente según reglas bien determinadas que uno puede descubrir, reglas que son al mismo tiempo la garantía de la objetividad absoluta de su juicio.147 Como ahora sabemos, el problema de la decisión no tuvo una respuesta favorable en los casos más importantes: en 1936-7 Alan M. Turing y Alonso Church, de manera independiente, mostraron la imposibilidad de que tal procedimiento exista con relación 146 Ignorabimus = Ignoraremos en latín. [Nota del autor] 1928. Cita tomada de la traducción al francés, p. 185. En el pasaje hay un reconocimiento implícito de que la formalización es completa, aunque falta la prueba de ello. 147 Hilbert, 4.4. E L PROGRAMA 249 al cálculo de predicados y a la aritmética, al menos no con los medios disponibles.148 Esto significó un duro revés a las pretensiones de Hilbert: no hay un procedimiento para determinar la validez de las fórmulas del cálculo de predicados –el problema central de la lógica, en sus propias palabras–, como tampoco parece haber una forma mecánica para decidir, en principio, si todo problema matemático tiene o no solución.149 Como sea, la mayor frustración del programa no vino de este fracaso, sino de la caída de su principal objetivo: la proyectada prueba de consistencia. Estas cuestiones serán tratadas en el siguiente capítulo. Para terminar, algunos comentarios: 1. Es obvio que Hilbert no ideó el programa de un solo golpe, sino que lo fue afinando con el paso del tiempo. En (Hilbert, 1922) comenzó a utilizar los términos “teoría de la demostración” y “metamatemáticas”, y formuló su punto de vista finitista con su dramático “en un principio era el signo”; en (Hilbert, 1925) realizó un análisis del papel del infinito en la matemática, expuso con cierto detenimiento lo que entendía por métodos finitistas, y anunció una prueba de la hipótesis del continuo cuya terminación, dijo, sólo dependía de la prueba de un lema; en (Hilbert, 1927) presentó una formalización de la teoría de los números que incluía las clases transfinitas de Cantor y ofreció una formulación muy simple del problema de la consistencia para dicho sistema: sería suficiente con demostrar que la fórmula ¬(0 = 0) no es derivable en él (argumento aplicable a todos los sistemas de este tipo); en (Hilbert, 1928) planteó como un reto el problema de la completud para la teoría de los números y el análisis y abordó el problema de la decisión. A estas alturas, el programa se mostraba como algo maduro, con sus métodos, objetivos, sistemas formales y soporte filosófico bien decantados. Al respecto, el lector habrá notado que nosotros abordamos el programa siguiendo un orden distinto al de su desarrollo histórico, haciendo referencia a sus conceptos antes que al orden en que se presentaron. 2. Hilbert confiere a la teoría de la demostración (tal como él la entiende) el rango de una ciencia, opinión con la que todo mundo estaría de acuerdo. En lo que hay discrepancias es en torno al siguiente problema: ¿lo es en la misma medida que la Aritmética o el Análisis? Según Hilbert, el lugar que le corresponde es de primera línea: “[...] el desarrollo de las matemáticas tiene lugar mediante la alternación constante de dos niveles. En primer término, obteniendo nuevos teoremas, esto es, nuevas fórmulas demostrables a partir de los axiomas, por medio de la inferencia formal; en segundo, añadiendo nuevos axiomas junto con la prueba de su consistencia mediante una argumentación concreta.”.150 La teoría de la demostración sería, según esto, una pieza esencial en el imprevisible 148 Cf. [Church, 1936] y [Turing, 1937]. Pronto volveremos a este punto. De igual manera, el lector podrá acudir al §8 de [Torres, 2000], donde hallará algunos comentarios relativos a este problema. 149 A esta cuestión habremos de volver más adelante como parte de un debate más extenso. 150 Hilbert, 1922. Cita tomada de la traducción al español, p. 59. 250 4. E L PROGRAMA DE H ILBERT desarrollo de la matemática. A lo anterior habría que agregar la siguiente acotación de Cavaillès, en la que nos advierte el alto rango que Hilbert le confiere a esta teoría: “La metamatemática, o teoría de la demostración, deviene la verdadera ciencia: sus objetos serán las reuniones de signos o fórmulas y la organización de éstos en unidades de dependencia o teorías. Es en el agrupamiento de éstas, en la adjunción de axiomas y en la prueba de su fecundidad relativa, en lo que consiste el trabajo real, capaz de procurar una verdad.”151 Al respecto Bourbaki opina que estas pretensiones son injustificadas: Una consecuencia de esto [la idea de que toda teoría se debía justificar con una prueba de consistencia] fue la creencia, muy extendida también entre los formalistas, de que la teoría de la demostración formaba parte integrante de la matemática, de la que constituía un preámbulo indispensable. Este dogma no nos parece justificado, y consideramos que la intervención de la metamatemática puede y debe reducirse a la parte muy elemental que trata del manejo de los símbolos abreviadores y de los criterios deductivos. No se pretende con esto, contrariamente a lo que decía Poincaré, “reivindicar la contradicción”, sino más bien considerar, con Hadamard, que la ausencia de contradicción, aunque no se demuestre, se constata.152 No deja de ser extraño que mientras para algunos la teoría de la demostración es una disciplina fundamental, para otros, que favorecen el enfoque axiomático de Hilbert, apenas si ocupa un lugar secundario al exterior de la matemática. 3. Desde el punto de vista adoptado por Hilbert en los años veinte, la matemática pura habría de ampliarse siguiendo una doble pauta: derivando de los axiomas nuevos teoremas y agregando nuevos axiomas como ampliación de sus teorías, junto con la correspondiente prueba de no contradicción. Es así que la matemática constituiría una disciplina autónoma, autosuficiente y libre de abrirse camino en todas las direcciones posibles, teniendo como único límite la no contradicción. Esto no hace sino corroborar la tesis ya mencionada: con Hilbert la matemática deviene en la ciencia de lo posible. En esto, él fue el principal defensor de la libertad y autonomía que Cantor le confiere a la matemática. 4. En 1927 Brouwer señaló que las diferencias entre el formalismo y el intuicionismo se disiparían a partir del momento en que Hilbert aceptara las siguientes exigencias:153 a) La necesidad de diferenciar la construcción del “inventario de fórmulas”, de la teoría intuitiva que se ocupa de las leyes de tal construcción, y reconocer que la matemática intuicionista de los números naturales es indispensable para esta última teoría. 151 Cavaillès, 1938. Cita tomada de la traducción al español, p. 98. 1969. Cita tomada de la traducción al español, p. 63. 153 Cf. Brouwer, 1927. 152 Bourbaki, 4.4. E L PROGRAMA 251 b) Que el principio del tercero excluido no se puede utilizar indiscriminadamente, reconociendo, primero, que la investigación de la validez de este principio es algo justificado y forma parte del núcleo de las investigaciones en torno a los fundamentos de la matemática y, segundo, que la validez de este principio en la matemática informal (intuitiva) se limita a los conjuntos finitos. c) Que el principio del tercero excluido se identifica plenamente con el principio de que todo problema matemático es resoluble. d) Que la justificación de la matemática formal mediante una prueba (intuitiva) de consistencia encierra un círculo vicioso, pues se apoya en la suposición de que si una proposición es consistente, entonces es correcta (i. e., no puede ser falsa en cuanto a su contenido), lo cual supone la correctud (material) del principio del tercero excluido. En un tono conciliador, suavizando sus críticas, Brouwer añade que la escuela formalista sólo ha recibido beneficios del intuicionismo, y que debería de esperar más. “Es más, dice, la escuela formalista debería ponderar el hecho de que en el marco del formalismo nada de la matemática se ha asegurado a la fecha (pues, después de todo, la prueba metamatemática de la consistencia del sistema de axiomas es un faltante, hoy como ayer), mientras que el intuicionismo, [...] ha reedificado varias de las teorías matemáticas con propiedad y firmeza. Si, por lo tanto, la escuela formalista [...] ha detectado modestia por parte del intuicionismo, debería de aprovechar la ocasión para no quedar rezagada con relación a esta virtud.”154 Si bien Hilbert estaría de acuerdo en lo fundamental con los tres primeros puntos, el cuarto de ellos le parece simplemente inadmisible. Además, el intento de conciliación llegó demasiado tarde, justo en el momento en que Hilbert lanzaba las campanas al aire seguro de lograr lo que se había propuesto, y no sólo eso: también lo hizo justo en el momento en que su postura reduccionista se había agudizado al máximo, al punto de creer que el problema de la decisión estaba al alcance de la mano (un síntoma de arrebato). Por supuesto, nada fue del intento por llegar a un arreglo.155 4.4.5. El programa: un resumen Podemos resumir el programa de Hilbert como sigue: 1. Formalizar la matemática clásica. 2. Demostrar, con base en la matemática finitista, que la formalización es consistente. 3. Demostrar, cuando sea el caso, que la formalización es sintácticamente completa. 154 Brouwer, 1927. Cita tomada de la traducción al inglés, p. 492. saber la verdadera manera en que Hilbert “disipó en definitiva” las diferencias entre el formalismo y el intuicionismo, tal como lo estaba pidiendo Brouwer, véase el apéndice I. 155 Para 252 4. E L PROGRAMA DE H ILBERT 4. Construir un algoritmo para determinar la validez de las fórmulas del cálculo de predicados. El programa se sustenta en la idea de que la matemática clásica se puede reducir a un sistema formal, es decir, que es posible formalizar por completo la matemática clásica y que la noción sintáctica de derivación formal es el correlato preciso de las nociones de verdad y demostración de la matemática usual. En cuanto a la prueba de consistencia, si bien no hay una definición precisa del concepto de “demostración finitista”, Hilbert no considera necesario contar con tal definición, pues una vez hecho el trabajo, el análisis de los métodos utilizados descubrirá si éstos son o no satisfactorios. Visto desde la matemática, el programa de Hilbert se presenta como un examen de la estructura lógica de la matemática clásica a fin de probar su consistencia. No obstante, también es la expresión de un proyecto filosófico que podemos abreviar así: Fundamentar la matemática en la intuición pura del signo156 Desde este punto de vista, el programa se contempla como un intento por sustentar la legitimidad de las principales teorías matemáticas (la aritmética y el análisis) sobre una base intuitiva, ligada a la sensibilidad, y establecer este hecho al interior de la matemática misma. Así, con la realización de su proyecto Hilbert pretende resolver un problema filosófico, no mediante la discusión verbal, sino dando respuesta a cuestiones precisas, es decir, haciendo matemáticas. Podemos decir entonces que la posición de Hilbert es la de abrir paso a una filosofía derivada de las matemáticas, una filosofía matemática, en oposición a una filosofía de las matemáticas que buscaría ajustar el trabajo concreto de los matemáticos a posiciones tomadas desde afuera de esta ciencia. En cuanto a las restricciones impuestas al programa, Hilbert busca satisfacer con ellas las exigencias de Brouwer, no al momento de construir las teorías matemáticas, sino al probar su consistencia. A cambio de ello, lo que espera es que Brouwer y Weyl reconozcan como algo lícito valerse de cualquier noción cuya compatibilidad con los principios constructivos de la teoría se pruebe de esta manera, propuesta que Brouwer nunca aceptó. Los problemas que con el paso del tiempo anexó Hilbert al programa son un signo de optimismo y pérdida de la perspectiva, sobre todo con relación a lo que se podía esperar de una empresa de tal naturaleza. Prueba de ello es el hecho de que aun sin haber logrado nada en concreto, en diversas ocasiones proclamó tener prácticamente resuelto el problema de la consistencia o el problema de la completud de los axiomas aritméticos.157 Indudablemente, Hilbert representa una figura que no se arredra ante 156 En ningún lugar Hilbert hace algún señalamiento de esta índole. Más bien, se trata de una conclusión a la que llegamos a través del examen de sus ideas y del análisis de su programa. 157 Por ejemplo, en (Hilbert, 1928), da por un hecho que la prueba del isomorfismo de los modelos de la aritmética (de segundo orden) no va más allá de la matemática finitista y de este isomorfismo se sigue la completud de los axiomas. De manera semejante, en [Hilbert, 1927], sugiere que la consistencia del análisis es cuestión de minucias, que sólo depende de la extensión finitista del método de Ackermann para la aritmética elemental restringida. 4.4. E L PROGRAMA 253 los problemas, pero la posteridad también lo recordará como alguien que “perdió piso” y creyó poder lograr más de lo que se podía. La forma final de su programa parece fuera de toda proporción y nos debe servir como una advertencia de que detrás de las cosas de simple apariencia se pueden ocultar enormes dificultades. En su momento, el programa dominó prácticamente toda la escena. Para superarlo, para dar fin a su hegemonía y al radicalismo epistemológico de Hilbert, se requirió de algo más que buenas intenciones. No servía de nada continuar una polémica que en el plano filosófico ya no tenía salida. Por el contrario, había que tomarle la palabra a Hilbert y examinar los alcances de su programa en un sentido matemático, ver qué tan lejos se podía ir con los medios propuestos y así seguir construyendo una filosofía matemática, una filosofía que en vez de argumentos bizantinos ofreciera teoremas y demostraciones. En esto, Gödel fue quien mejor entendió las cosas: en vez de polemizar con él, como único argumento le presentó dos teoremas que sacudieron desde sus cimientos no sólo al programa, sino a la visión sintáctica que Hilbert había forjado de la matemática. Pero esto será el tema de nuestro siguiente capítulo. Por lo pronto, queremos concluir con un comentario en torno a la importancia y significación histórica del programa. Ciertamente, la aparición del programa fue un parteaguas en el desarrollo de la lógica y el estudio de los fundamentos de la matemática. Con él, Hilbert introdujo nociones y procedimientos inéditos que el tiempo incorporó al acervo matemático. La forma en que aborda los problemas en el programa no sólo es original, sino enriquecedora, y las cuestiones en él planteadas siguen siendo el motor de múltiples investigaciones. Quizá ésta fue la principal virtud del programa: transformó muchos problemas relativos a las teorías matemáticas en problemas matemáticos.158 En cuanto a las aportaciones de Hilbert a la lógica y al estudio de los fundamentos, podemos decir que la más importante de todas fue la creación de una nueva rama de las matemáticas: la teoría de la demostración. Y si bien en este dominio la contribución de Hilbert no se puede medir por los resultados alcanzados, fue él quien trazó los caminos por donde habrían de proseguir las investigaciones.159 En gran medida, los problemas planteados en el programa sellaron el destino de toda una generación de investigadores, y sólo desde su perspectiva se puede entender el rápido avance de la lógica matemática en los años treinta. Sin temor a equivocarnos, podemos decir que sin Hilbert muchos de los resultados obtenidos en este dominio no se habrían ni siquiera vislumbrado en su momento, y su llegada se habría aplazado por tiempo indefinido. En particular, la mejor perspectiva de los teoremas limitativos de Gödel, Church, Tarski y Turing es desde el programa, que les da pleno sentido y significación, y en el que tienen sus raíces. 158 Por ejemplo, los problemas relativos a la consistencia y la completud se transformaron en problemas de combinatoria, propios de la aritmética finitista. 159 No deja de ser sorprendente que Hilbert no dejara resultados de importancia en esta área: ningún teorema lleva su nombre. En este sentido su relevancia la debemos medir, no por las soluciones obtenidas, sino por el impulso que dio a la investigación con los problemas planteados. Hilbert merecidamente es “el padre de la teoría de la demostración”, aunque ningún teorema importante se deba a él. 254 4. E L PROGRAMA DE H ILBERT Debemos, entonces, revalorizar el programa como una fuente de ideas y métodos que cambiaron radicalmente el enfoque y el modo de analizar el problema de los fundamentos de la matemática.160 Más allá de los intentos fallidos y del fracaso del programa (no reconocido por todos), Hilbert puede reclamar para sí el haber desplazado el problema de los fundamentos a otro nivel. Con vehemencia, nos enseñó que la comprensión del concepto de infinito implica entender la maquinaria transfinita con que se le maneja, y nos enfrentó a la posibilidad de eliminar tal maquinaria desde la matemática finitista. También nos enseñó, junto con Brouwer, que la lógica no es un supuesto tácito en la construcción de las teorías, sino algo que debemos edificar de manera simultánea, y que el problema de los fundamentos se puede investigar sintácticamente, haciendo de las teorías un objeto de estudio. Esto significó un viraje con relación a la concepción de Frege y Russell, para quienes la idea de examinar el sistema de la lógica estaba más allá toda consideración, pues se trataba de un cuerpo de conocimientos sistematizado que lo abarcaba todo, de modo que no había lugar para consideraciones metateóricas relativas a su alcance y estructura. Tras la invención de la metamatemática podemos decir que ya no es creíble una postura de esta naturaleza, que se mira, por decir lo menos, ingenua. Sin duda, el programa de Hilbert cambió por siempre la faz de las investigaciones; la prueba la tendremos en el siguiente capítulo, cuando veamos los teoremas de Gödel. 4.4.6. Comentarios finales 1. En su obra, Hilbert tiene que conciliar dos posturas aparentemente incompatibles. Por una parte, su disposición a admitir como objeto de estudio cualquier sistema de objetos que la mente humana pueda concebir; por la otra, su férreo escepticismo que lo lleva a negar que la matemática sea el reflejo de algún tipo de realidad. La tensión entre estos dos factores se manifiesta con toda su fuerza en la defensa que emprende de la matemática transfinita, donde, sin renunciar a ninguna de sus partes, evita el realismo conceptual de Cantor. Al parecer, las experiencias de Hilbert en la primera parte de su carrera tuvieron un significado especial en la conformación de estas dos posturas. Cuando estudiante, tuvo la oportunidad de ahondar en la filosofía de Kant, cuya influencia en su pensamiento es innegable. Fue de él de quien asimiló el modo característico con el que mira a la ciencia, sobre todo en lo concerniente a la cautela y disposición a evitar toda suposición metafísica.161 160 Como bien dice Hermann Weyl, tras la intervención de Hilbert y Brouwer no es posible un retorno al punto de vista de Russell y Whitehead en Principia Mathematica. La cita exacta es la siguiente: “Sin importar lo que traiga el futuro, no cabe duda de que Brouwer y Hilbert elevaron el problema de los fundamentos a un nuevo nivel. Un retorno al punto de vista de Russell y Whitehead en Principia Mathematica es impensable.” [Weyl, 1944a]. Cita tomada de Reid, 1970, pp. 273-274. 161 No debemos olvidar que Hilbert creció en la ciudad de Königsberg, donde Kant viviera toda su vida, y que realizó sus estudios en la misma universidad donde Kant fuera profesor; fue ahí también donde se 4.4. E L PROGRAMA 255 En cuanto a la matemática, Hilbert fue en su vida profesional un artífice de la expansión de los métodos de demostración admitidos en ella, a la vez que un fuerte crítico de sus fundamentos.162 Su capacidad para abordar y resolver problemas pronto le ganó fama y prestigio. Quizá en ello echa raíces su convicción de que todo problema matemático es resoluble. De la física aprendió que la matemática es una herramienta fundamental en el conocimiento de la naturaleza y que como tal no se le puede limitar. De Cantor aprendió a imaginar un mundo cuya legitimidad fue puesta en entredicho por las paradojas, y se sumó a su defensa, haciendo suyo el alegato en favor de la libertad y la autonomía de la matemática. Prudencia y audacia a la vez, dos actitudes antagónicas que entraban en conflicto y que Hilbert debía conciliar. Esto lo creyó posible mediante la adopción del método axiomático y la formalización.163 En efecto, para reconciliar su fe irrestricta en la razón, capaz de conquistar el infinito, con la negativa a admitir una postura realista, Hilbert se escuda en la reconstrucción axiomática y, tras de ella, en la formalización. Fue por ello que en un comienzo identificó la existencia matemática con la no contradicción, pues ése era el mejor camino para evitar todo tipo de suposiciones innecesarias, a la vez que dejaba abierta la posibilidad de tratar con entidades abstractas de todo tipo. Este último planteamiento es independiente del programa y se le puede sostener sin necesidad de aceptar los objetivos y los principios epistemológicos que éste persigue y supone. 2. Hilbert rechaza la opinión de que el verdadero rigor sólo se puede alcanzar en la aritmética y quizá en el análisis. Por el contrario, sostiene que éste es asequible por igual en todas las ramas de la matemática, que pueden ser tratadas de la misma manera: inició como docente. Tal como lo advierte Constance Reid [Reid, 1970, p. 3], Hilbert creció, como todos los niños de esa ciudad, “con las palabras de Kant en su mente y en sus oídos.” Al respecto, sabemos que todos los meses de abril asistía, en compañía de su madre que tenía inclinación por la filosofía, al sepulcro de Kant a depositar una corona de laureles con motivo del natalicio de este pensador. Kant es el único filósofo del que Hilbert reconoce alguna influencia y las citas a él son la únicas que se multiplican en sus escritos. También sabemos que en ocasión de su examen doctoral Hilbert debió defender dos tesis de su elección. Según lo consigna Constance Reid (Reid, 1970, p. 16), uno de los temas que eligió se relaciona directamente con la filosofía de Kant: Que las objeciones a la teoría kantiana de la naturaleza a priori de los juicios de la aritmética, son infundadas. Esto nos muestra también que su interés por la filosofía de la matemática se remonta a su vida como estudiante. 162 Hasta antes de la elaboración del programa, Hilbert siempre dio muestras de prudencia en el plano filosófico y de audacia como matemático. Por ejemplo, él fue quien realizó la primera demostración en matemáticas de la existencia de un objeto por reducción al absurdo. De eso hablaremos en diversos lugares y, en particular, en el apéndice T. 163 Ciertamente, con la formalización el conflicto quedaría resuelto: una teoría formalizada es un objeto simbólico (dentro del alcance de la matemática finitista), respecto al cual nada importa el significado que puedan tener sus expresiones. 256 4. E L PROGRAMA DE H ILBERT [...] yo creo que sin importar de dónde provengan las ideas matemáticas, si de la teoría del conocimiento o la geometría, o de las teorías de la ciencia natural o de la física, surge el problema para la ciencia matemática de investigar los principios subyacentes a estas ideas, y por ende la cuestión de establecer para ellos un sistema simple y completo de axiomas, de manera que la exactitud de las nuevas ideas y su aplicabilidad a la deducción no será inferior en ningún sentido a aquella de los conceptos aritméticos.164 Hay en este pasaje una idea sobre la que queremos llamar la atención. Se trata de la idea de que en la matemática no hay grandes misterios, ni nada incomprensible para el hombre común. Claro está que para alcanzar un resultado primero se le debe conjeturar y probar, todo lo cual requiere de una gran dosis de creatividad e imaginación. Sin embargo, una vez en posesión de un teorema, éste se debe integrar a la teoría mediante un argumento racional que no encierre ningún misterio: en la matemática no hay lugar para los arcanos. De hecho, Hilbert llegó al extremo de creer que todos los medios demostrativos a nuestro alcance –“la técnica de nuestro pensamiento”, como dice en la cita de la sección 4.4.3– se podrían formalizar de una vez por todas. Su error consistió en suponer que esto se podría lograr de manera exhaustiva. Como veremos, tras los teoremas de Gödel sabemos que la matemática estará por siempre abierta a la posibilidad de incorporar nuevos métodos de demostración –nuevos principios– en cada fase de su desarrollo. Sin embargo, y a pesar de esta falsa apreciación, las ideas de Hilbert constituyeron en su momento una refutación del subjetivismo intuicionista, dejando en claro que cualquier individuo armado de tiempo y paciencia puede entender cualquier demostración, pues en última instancia ésta deberá exponerse de manera ordenada con apego a los cánones de la lógica. A su vez, esto último lo llevó a la idea de que si la demostración matemática es mecanizable165 , las teorías podrían ser decidibles. En nuestros días estas ideas, al igual que los métodos desarrollados a partir de la propuesta de Hilbert, han conducido al desarrollo de interesantes estrategias de búsqueda de pruebas para conjeturas con base en la inferencia formal. A la disciplina que se ocupa de estos menesteres se le conoce como demostración automática de teoremas, una rama especializada de las ciencias de la computación. Se trata de un dominio en el que las ideas de Hilbert sobre la formalización han sido fructíferas y muestran su verdadero alcance. 164 Hilbert, 1900. Cita tomada de la traducción al inglés, p. 5. 165 Mecanizable: procedimiento que puede llevarse a cabo mediante la aplicación de un reducido número de reglas fijas. Esta noción la debemos distinguir de automatizable, en la que además se exige que el orden de aplicación de las reglas esté determinado de antemano, como sucede en la demostración automática de teoremas. Capítulo 5 La intervención de Gödel 5.1. El espíritu de una época: verdad y demostrabilidad La primera vez que Hilbert oyó hablar de Gödel fue en 1930. Un año antes, a los veintitrés años de edad, este joven matemático había demostrado que el cálculo de predicados de primer orden es completo, en el sentido de que toda fórmula válida es derivable en él.1 Esta demostración era una solución al problema planteado por Hilbert y Ackermann en 1928 y marchaba acorde con las expectativas del programa: las leyes de la lógica clásica estaban codificadas plenamente en dicho cálculo y no se requería de ningún axioma lógico adicional para asegurar que todas las consecuencias lógicas de cualquier conjunto de hipótesis se podían derivar de él. No obstante, Gödel no era un seguidor incondicional del programa, como lo era Herbrand, y a un tiempo que demostraba el teorema de completud extendida, consideraba la posibilidad de que en Principia Mathematica y sistemas afines hubiera problemas irresolubles, enunciados indecidibles. 5.1.1. La introducción de 1929 Gödel demostró el teorema de completud como parte de su disertación doctoral en 1929, y lo dio a conocer en 1930 en un artículo que coincide en lo básico con dicho trabajo.2 No obstante, en el texto de 1930 Gödel omite la introducción de su trabajo doctoral, en la que expone sus dudas respecto a los puntos de vista de Hilbert y Brouwer.3 En ella, Gödel aborda de manera crítica la cuestión de la resolubilidad de todo problema matemático y sugiere la posibilidad de probar la existencia de problemas irresolubles para un sistema formal. 1 Ya nos hemos referido a este resultado en la sección 4.4.4. Gödel, 1930. 3 Cf. Gödel, 1929 y Gödel, 1930. La tesis doctoral de Gödel no se publicó sino después de su muerte en (Gödel, 1986). Según parece, la omisión de la introducción tuvo como causa el rechazo de Gödel a la crítica y a la discusión de sus puntos de vista, una actitud prudencial muy bien caracterizada por Solomon Feferman en un célebre trabajo en el que, justamente, aborda esa extraña mezcla de convicción y cautela de la que Gödel siempre hizo gala. Cf. Feferman, 1988. 2 V. 257 258 5. L A INTERVENCIÓN DE G ÖDEL Gödel afirma que el teorema de completud es, en cierto sentido, el complemento teórico del método usual para probar la consistencia de un sistema de axiomas mediante la exhibición de un modelo. Aclaremos la cuestión haciendo un recuento de los resultados que entran en juego. En primer lugar tenemos el teorema de completud mismo: 1. Toda fórmula válida perteneciente al lenguaje del cálculo de predicados es derivable en dicho sistema. Junto a esta presentación del teorema tenemos la forma extendida, que es en realidad la que Gödel demuestra en su trabajo. Esta segunda versión pone de manifiesto la relación existente entre la noción semántica de modelo y la noción sintáctica de derivación formal: 2. Todo conjunto infinito numerable de enunciados de la lógica de primer orden o tiene un modelo, o contiene un subconjunto finito cuya conjunción es refutable. Asimismo, Gödel hace referencia a un teorema demostrado por Skolem en 1922, el cual resulta equivalente al teorema de completud extendida: 3. Si un conjunto de enunciados pertenecientes a la lógica de primer orden es consistente, entonces tiene un modelo. La afirmación de que el teorema de completud extendida es el complemento teórico del método usual para probar consistencia (el método de los modelos), Gödel la apoya en que dicho teorema “nos garantiza que en cada caso el método conduce a su meta, es decir, que uno debe ser capaz de producir una contradicción o probar la consistencia por medio de un modelo.”4 No obstante, Gödel advierte que la existencia del modelo en cuestión no tiene un soporte constructivo: “Sin duda, la existencia de esta alternativa no está demostrada en el sentido intuicionista (es decir, mediante un procedimiento de decisión).”5 En efecto, la posibilidad de disponer de un modelo es sólo teórica, pues no se cuenta con un procedimiento efectivo para construirlo. Esta última observación le da pie a Gödel para confrontar su postura con las de Brouwer y Hilbert. Como sabemos, en algún momento Hilbert llegó a aceptar como existente cualquier noción introducida mediante un sistema de axiomas consistente. Brouwer, por el contrario, juzga que las pruebas de consistencia no tienen ningún valor y las desestima como signo de la existencia de las nociones implicadas; es más, rechaza las pruebas de consistencia como algo fuera de control y sostiene que éstas ni siquiera aseguran la corrección del sistema.6 Como a continuación veremos, Gödel se aparta tanto de la 4 Gödel, 1929. Cita tomada de la traducción al inglés, p. 61. ibid, nota al pie 2. 6 En distintos lugares Brouwer traza una clara línea divisoria entre lo que llama teorías correctas y teorías consistentes; uno de ellos es el siguiente: “No necesitamos de ninguna manera desesperarnos por alcanzar esta meta [la prueba de consistencia], pues nada de valor matemático se logra con ello: una teoría incorrecta, incluso si no puede ser inhibida mediante una contradicción que la refute, no es por ello menos incorrecta, lo mismo que un plan de acción criminal no es menos criminal cuando no puede ser frenado por una corte que lo pudiera inhibir.” [Brouwer, 1923. Cita tomada de la traducción al inglés, p. 336]. 5 Gödel, 5.1. E L ESPÍRITU DE UNA ÉPOCA : VERDAD Y DEMOSTRABILIDAD 259 ciega creencia de Hilbert en el poder de los métodos formales, como del desdén que Brouwer profesa hacia la formalización. Gödel comienza relacionando la definición de existencia matemática propuesta por Hilbert con la cuestión de la resolubilidad de todo problema matemático: Sin embargo, esta definición [de existencia matemática] [...] presupone claramente el axioma de que todo problema matemático es resoluble. O, para ser más precisos, presupone que no podemos probar la irresolubilidad de cualquier problema, pues si se probara la irresolubilidad de algún problema (en el dominio de los números reales), entonces, de la definición anterior se seguiría la existencia de dos realizaciones no isomorfas del sistema axiomático para los números reales, mientras que por la otra parte podemos demostrar que dos realizaciones cualesquiera son isomorfas entre sí. No obstante, no podemos excluir del todo una prueba de la irresolubilidad de un problema si observamos que lo que está en juego es tan sólo la irresolubilidad de un problema mediante ciertos medios de inferencia formales establecidos con precisión, pues todas la nociones que aquí consideramos (derivable, consistente, y así sucesivamente) sólo tienen un significado exacto cuando hemos delimitado con precisión los medios de inferencia admitidos. Incidentalmente, estas reflexiones están destinadas tan sólo a aclarar las dificultades que estarían conectadas con tal definición de la noción de existencia, sin hacer ninguna aseveración definitiva acerca de su posibilidad o imposibilidad.7 Del pasaje anterior sólo queremos resaltar dos aspectos. Por una parte, que el argumento de Gödel –según el cual la noción de existencia matemática propuesta por Hilbert presupone la resolubilidad de todo problema matemático– es erróneo. Por otra parte, destacar la idea en ciernes de que pudiera haber problemas no resolubles con los medios de inferencia formal establecidos, cuya irresolubilidad se pudiera demostrar mediante un razonamiento metamatemático. Figura 5.1. Esquema en el que se ilustra la idea de Gödel. Un problema p puede ser irresoluble en el sistema formal, y haber una prueba metamatemática de que tal es el caso. 7 Gödel, 1929. Cita tomada de Gödel, 1986, pp. 61-63. 260 5. L A INTERVENCIÓN DE G ÖDEL En lo que sigue consideraremos por separado estas cuestiones, pues en cierto sentido son independientes una de la otra. Como veremos, aunque Hilbert efectivamente sostuvo el principio de que todo problema matemático es resoluble, el argumento que Gödel presenta es inexacto, pues no contempla la distinción entre lógica de primer orden y lógica de segundo orden que se encuentra tras los teoremas en que apoya su razonamiento. A. El argumento de Gödel Gödel sostiene lo siguiente: que la definición de existencia matemática como ausencia de contradicción presupone el principio de que todo problema matemático es resoluble. El argumento sería, mutatis mutandis, el siguiente. Supongamos que se acepta la definición de existencia matemática como ausencia de contradicción, a la vez que se acepta la posibilidad de que haya problemas irresolubles, digamos en el sistema de los números reales R. Sea p un problema irresoluble en dicho sistema. Dado que ni p ni su negación ¬p son derivables en R, las teorías axiomáticas R1 = R ∪ {p} y R2 = R ∪ {¬p} son consistentes y, por lo tanto, cada una de ellas tiene un modelo, digamos M1 y M2 , respectivamente. Nótese que ambas realizaciones son modelos de R, pues tanto R1 como R2 lo incluyen como subsistema. No obstante, M1 y M2 no son isomorfos entre sí, en contra de lo que establece el teorema que demuestra la categoricidad de R, pues M1 realiza al enunciado p, mientras que M2 realiza su negación ¬p.8 Por lo tanto, no podemos asumir la existencia de problemas irresolubles, y dado un enunciado p perteneciente al lenguaje del sistema, o bien p o bien ¬p es derivable a partir de R, es decir, R es completo. El argumento anterior se apoya en el supuesto de que todas las realizaciones del sistema de los números reales son isomorfas entre sí y tienen la misma estructura, por lo que sus elementos se pueden poner en correspondencia biunívoca de modo tal que los elementos correspondientes obedezcan a las mismas leyes y reglas.9 8 Aquí, Gödel asume que R es una teoría de segundo orden, pues sólo así puede aducir la categoricidad del sistema, haciendo valer un teorema que pertenece a la lógica de segundo orden. El sistema R podría incluir, por ejemplo, al axioma del supremo. 9 El que una teoría sea categórica es lo máximo que podemos esperar de ella, pues esta propiedad incluye la completud del sistema. Cuando dos modelos son isomorfos, podemos decir que se trata de la misma estructura, i.e., que los modelos son idénticos entre sí salvo por el “color” de sus elementos. V. gr., los números reales se pueden construir como cortaduras de Dedekind (conjuntos de números racionales) o como sucesiones de Cauchy (sucesiones de números racionales), obteniéndose en ambos casos lo mismo: dos estructuras en las que los elementos básicos se pueden mapear uno a uno mediante un isomorfismo que preserva el orden y las operaciones aritméticas (recordemos que en la matemática pura la naturaleza específica de los objetos considerados se considera irrelevante, siendo lo único importante la manera en que éstos se relacionan entre sí). Al respecto, ninguna teoría de primer orden que tenga un modelo infinito puede ser categórica, es decir, no puede ser descriptiva de una única estructura (teorema de Löwenheim-Skolem). A lo más que se puede aspirar es a que, en cada nivel cardinal transfinito, todos sus modelos sean isomorfos entre sí. Esto sucede cuando la lógica subyacente es de segundo orden, como en el caso original de los axiomas de Peano o el de los axiomas del sistema de los números reales. 5.1. E L ESPÍRITU DE UNA ÉPOCA : VERDAD Y DEMOSTRABILIDAD 261 No obstante, esto sólo sucede para el sistema de los números reales cuando sus axiomas se enuncian en un lenguaje de segundo orden, en el que además de cuantificar sobre individuos se pueden construir enunciados universales sobre todos los conjuntos de números reales o todas las funciones de R en R.10 En tal caso, y sólo entonces, se puede demostrar que todas las realizaciones del sistema son isomorfas entre sí. Una objeción al argumento de Gödel es que la lógica de segundo orden no se considera adecuada con relación a los fundamentos de la teoría de los números reales, pues su semántica presupone una fuerte dosis de teoría de conjuntos. Y sin el teorema del isomorfismo, que más que a la lógica pertenece al álgebra, el argumento de Gödel se viene abajo, pues en el caso de la lógica de primer orden sucede exactamente lo contrario: con base en el teorema de Löwenheim-Skolem, sabemos que ninguna teoría (formulada en un lenguaje de primer orden) que tenga un modelo infinito puede ser categórica. Esta falta de distinción entre propiedades de primer y segundo orden es una muestra del estado en que se encontraban las investigaciones lógicas en aquel momento y no podemos inculpar a Gödel por ello; además, una vez hecha la distinción, podemos decir que ésta sólo afecta localmente al razonamiento de Gödel, no a sus objeciones en torno al concepto de existencia matemática propuesto por Hilbert. B. La cuestión de la irresolubilidad Sin lugar a dudas, de las propuestas que Gödel arriesga en la introducción a su disertación doctoral, la más significativa es la de probar que un problema matemático es irresoluble con los medios disponibles en un sistema formal. Esta idea equivale a sugerir la existencia de proposiciones indecidibles con relación a un sistema axiomático. En este sentido Gödel es muy claro al señalar que la irresolubilidad no es una cuestión absoluta, sino relativa, y que para hablar de este problema es necesario especificar los medios considerados. Sin lugar a dudas el comentario está dirigido a Hilbert, quien aborda la cuestión de la resolubilidad, no desde el punto de vista de algún medio 10 Por ejemplo, el axioma de inducción para la aritmética de los números naturales se expresa en un lenguaje de segundo orden como sigue: ∀X ⊆ N([0 ∈ X ∧ ∀z(z ∈ X → sz ∈ X)] → X = N) [Paráfrasis: Para todo conjunto X de números naturales, si 0 pertenece a X y para todo número z, si z pertenece a X entonces el sucesor de z también pertenece a X, entonces X es el conjunto N de los números naturales.] Nótese que en este caso el cuantificador “∀z” se refiere a números naturales, mientras que el cuantificador “∀X” se refiere, no a números naturales, sino a conjuntos de números naturales, de modo que el axioma de inducción se hace valer para todos los subconjuntos de N. En cuanto a la lógica de primer orden, donde no se permite cuantificar conjuntos de números, sino únicamente individuos, el axioma de inducción, característico de los números naturales, lo tenemos que enunciar para cada fórmula individual A(x) que se pueda construir en su lenguaje: (A(0) ∧ ∀z[A(z) → A(sz)]) → ∀zA(z) [Paráfrasis: Si 0 tiene la propiedad A, y para todo número z, si z tiene la propiedad A, entonces el sucesor de z también tiene dicha propiedad, entonces todos los números naturales tienen la propiedad A]. Nótese que en este caso el axioma sólo se hace valer para aquellos conjuntos X ⊆ N que son definibles mediante una fórmula A(x) del lenguaje, más no para el resto, lo cual permite tener modelos de los axiomas de Peano que no coinciden con lo que tradicionalmente entendemos como “números naturales”. 262 5. L A INTERVENCIÓN DE G ÖDEL específico, sino a la luz de todos los medios imaginables, lo cual para Gödel no tiene ni pies ni cabeza: “[...] parece cuestionable que una noción de resolubilidad tan holgada –y, en consecuencia, la interpretación del principio del tercero excluido que entra aquí en la discusión– tenga siquiera algún sentido.”11 Ciertamente, Hilbert maneja la noción de resolubilidad en un sentido absoluto. Cuando afirma que en la matemática no hay lugar para el ignorabimus o que siempre podremos hallar la respuesta a cualquier problema, no dice nada acerca de los medios demostrativos. No obstante, este planteamiento del problema lo hace intratable desde un punto de vista matemático, pues la cuestión de la resolubilidad se presenta más como un acto de fe que como un asunto que se pudiera investigar de manera precisa. Justamente, lo que Gödel propone es sacar el problema de este contexto y ubicarlo en el horizonte matemático. Podemos decir entonces que cuando Gödel concluyó su tesis doctoral ya consideraba como una posibilidad real la existencia de proposiciones indecidibles en el sistema de los números reales,12 perfilando con ello la línea de investigación que a la larga lo llevaría a los teoremas de incompletud. Ciertamente, en este trabajo ya se levantan los espectros de la incompletud y la irresolubilidad. No deja de llamar la atención que estas ideas se le hayan ocurrido a Gödel justo en el momento en que, paradójicamente, parecía contribuir a la consecución del programa con su prueba de completud para el cálculo de predicados. 5.1.2. El espíritu de la época Cerramos esta sección con un comentario relativo al ambiente intelectual en que Gödel se hallaba inmerso por aquellos años y la actitud que asumió. En una carta fechada el 7 de diciembre de 1967 y dirigida a Hao Wang (1921-1996), Gödel dice lo siguiente: El teorema de completud es en realidad una consecuencia casi trivial del teorema de Skolem. Sin embargo, el hecho es que en aquel momento nadie (incluyendo al mismo Skolem) sacó la conclusión (ni del teorema de Skolem, ni, como yo lo hice, de consideraciones similares propias) [...] Esa ceguera [...] de los lógicos era en verdad sorprendente. Pero pienso que la explicación no es difícil de hallar. Ésta yace en la falta, bien difundida en ese momento, de la actitud epistemológica requerida hacia la metamatemática y el razonamiento no finitista. [...] La susodicha inferencia a partir del teorema de Skolem es en definitiva no finitista, al igual que cualquier otra prueba de completud para el cálculo de predicados. Por tanto, estas cosas no eran advertidas o eran pasadas por alto.13 11 Gödel, 1929, nota al pie 4. Cita tomada de Gödel, 1986, p. 65. que una proposición A es indecidible cuando ni ella ni su negación son derivables a partir de los axiomas. 13 Wang, 1974, pp. 8-9. 12 Recordemos 5.1. E L ESPÍRITU DE UNA ÉPOCA : VERDAD Y DEMOSTRABILIDAD 263 Ciertamente, el teorema de completud de Gödel entraba en conflicto con el espíritu de la época, pues comprendía nociones semánticas como las de satisfacción y verdad (con las que se define la noción de modelo) que eran mal vistas o consideradas como extrañas a la investigación matemática en aquel momento.14 Lo mismo se puede decir del teorema de finitud o compacidad, que Gödel demostrara en 1930 y cuya importancia no fue reconocida sino muchos años después.15 En gran medida, el desinterés por estos resultados se debió a su carácter enteramente semántico. De hecho, Gödel ni siquiera intentó una definición de los conceptos implicados. En una carta sin fecha y jamás enviada a un estudiante de nombre Yossef Balas, aparece un párrafo tachado en el que Gödel explica que “[...] a consecuencia de los prejuicios filosóficos de nuestro tiempo: 1) nadie estaba en busca de una prueba de consistencia relativa [del análisis] porque se consideraba axiomático que una prueba de consistencia tenía que ser finitista para que tuviera sentido, 2) el concepto de verdad matemática como contrapuesto al de demostrabilidad era visto con gran recelo y ampliamente descartado como carente de sentido.”16 No sólo Gödel se refiere en estos términos al ambiente que privaba en aquellos tiempos. Por ejemplo, Carnap, que dentro de la tradición del empirismo lógico tuvo el atrevimiento de abordar algunas cuestiones semánticas, comenta que cuando invitó a Alfred Tarski a hablar acerca de la noción de verdad en los lenguajes formalizados en un congreso internacional, Tarski manifestó cierto recelo, “pues creía que la mayoría de los filósofos, incluso aquellos que trabajaban en lógica moderna, no sólo se mostrarían indiferentes, sino hostiles a la explicación del concepto de verdad.”17 y añade: “En el Congreso se hizo evidente, en las reacciones ante los trabajos presentados por él y por mí, que las suspicaces predicciones de Tarski eran correctas [...] Había una vehemente oposición incluso por parte de los filósofos amigos nuestros.”18 Carnap concluye diciendo que “para los lectores jóvenes es difícil imaginar cuán fuertes eran en un principio el escepticismo y la resistencia activa en contra.”19 Según parece, las cosas no eran fáciles para quienes no se ceñían a los lineamientos del programa de Hilbert o a la visión del empirismo lógico, empeñado en el análisis sintáctico del lenguaje. 14 Véase, por ejemplo, Herbrand, 1930, pp. 175-176 de la traducción al inglés. 15 El teorema es el siguiente: Un conjunto Γ de enunciados tiene un modelo si y sólo si todo subconjunto finito Γ0 de Γ tiene un modelo. 16 Wang 1987. Cita tomada de la traducción al español, p. 137. Lo que sí se sabe es que Gödel escribió esta carta después del 27 de mayo de 1970, pues esa fecha aparece en una carta que Balas le envió a Gödel con algunas preguntas que este último intentaba responder. 17 Carnap, 1963. Cita tomada de Schilpp, 1963, pp. 61-62. El Congreso en cuestión era el Congreso Internacional para la Filosofía Científica, el cual se llevó a cabo en el mes de septiembre de 1935. El hecho de que para entonces los teoremas de Gödel no hubieran logrado una mayor apertura hacia las cuestiones semánticas es una prueba de lo poco difundido que éstos estaban, de la mala comprensión de su significado y de la negativa de algunos investigadores a abandonar la línea del programa, creyendo que aún había alguna posibilidad de escapar a las devastadoras consecuencias de los teoremas limitativos. 18 Carnap, Loc. cit, p. 62 19 Carnap, Ibid. 264 5. L A INTERVENCIÓN DE G ÖDEL Como quiera que sea, Gödel decidió no enfrentar abiertamente tal oposición. En silencio, sobrellevó el embate formalista acariciando una visión distinta de la matemática que, según su propio testimonio, le guió en las investigaciones. Gödel era un defensor del realismo conceptual y osaba suponer que la matemática era trascendente, que iba más allá de nuestra limitada experiencia.20 Fue desde tal perspectiva que abordó los problemas relativos a los fundamentos de la matemática, ahondando más que cualquier otro en las bases de esta disciplina. Como resultado nos legó un penetrante análisis del papel de la formalización en la matemática y un claro discernimiento de sus limitaciones. Como veremos, aunque el camino por el que Gödel llegó a sus teoremas estaba colmado de consideraciones semánticas, él supo presentarlos de manera que nadie pudiera negar su validez. De esto nos ocuparemos en la siguiente sección. 5.2. Los teoremas de Gödel Gödel dio a conocer sus teoremas de incompletud en 1931, en un escrito que no excede las veinticinco cuartillas y que cambió por completo nuestra forma de ver la matemática.21 Dichos teoremas reúnen grandes atributos: profundidad, belleza, sobriedad e innovación; en ellos Gödel establece ciertos límites al método axiomático y circunscribe lo que se puede esperar de él, fijando así una base para la crítica filosófica. En un lenguaje no técnico, podemos resumir estos teoremas como sigue. Sea M un sistema formal que incluye a la aritmética elemental. Si M es consistente, entonces: G1. (Primer teorema de incompletud) Se pueden encontrar enunciados aritméticos A de naturaleza relativamente simple tales que ni A ni su negación ¬A son derivables en M. G2. (Segundo teorema de incompletud) La fórmula C que enuncia la consistencia de M no es derivable en M, es decir, el sistema no puede formalizar ninguna prueba de su consistencia.22 Estos resultados marchan en la dirección opuesta a la del proyecto de Hilbert, el cual aspira, primero, a una formalización completa de la aritmética y, segundo, a una prueba 20 Quienes se sorprenden al descubrir el realismo de Gödel no se detienen a considerar que detrás de él hay una legítima convicción, tan antigua como la matemática misma: la de que sus regiones vitales versan sobre ideas que tiene existencia propia. Esta creencia la fortaleció tras sus investigación en torno a los fundamentos de la matemática, en las que vislumbró una matemática real, incompletable e inagotable desde el punto de vista axiomático. 21 El trabajo se titula “Über formal unentscheidbare Sätze der Principia mathematica und verwander Systeme I” (Sobre proposiciones formalmente indecidibles en Principia Mathematica y sistemas afines I) y fue recibido el 17 de noviembre de 1930 para su publicación en la revista Monatshefte für Mathematik und Physik, donde apareció en 1931 en el número 38, pp. 173-198. 22 Por lo pronto el lector deberá aceptar que se puede construir una fórmula C en el lenguaje de M que “afirma” la consistencia del sistema. 5.2. L OS TEOREMAS DE G ÖDEL 265 elemental de su consistencia. Estas cuestiones serán examinadas con detenimiento en los apartados 5.4.2 y 5.4.3; por ahora, nos limitaremos a señalar algunos puntos de interés con relación a los teoremas mismos, no a su lectura filosófica. 1. De manera velada, la noción de verdad se oculta detrás del enunciado G1, pues en un sentido intuitivo alguno de los enunciados A y ¬A es verdadero. Podemos decir entonces que lo que establece G1 es la incapacidad del sistema M para probar todos los enunciados verdaderos que se pueden formular en su lenguaje y reescribir el teorema como sigue: G1’. Si M sólo demuestra enunciados aritméticos verdaderos, entonces se pueden encontrar proposiciones aritméticas A de naturaleza relativamente simple que el sistema M no puede decidir.23 Este último enunciado hace intervenir la noción semántica de verdad en vez de la noción sintáctica de consistencia y es una versión semántica del primer teorema de Gödel. Como hemos señalado, Gödel ideó sus teoremas pensando en la noción de verdad, y en el fondo lo que demuestra es que la noción de “ser un enunciado aritmético verdadero” no se puede formalizar por completo, que la verdad y la demostrabilidad son dos nociones no coincidentes en el caso de la aritmética (claro, cuando aceptamos la usual noción semántica de “verdad” para las fórmulas de M, lo cual no haría un formalista extremo como, digamos, Herbrand). Aclarar esta cuestión fue una de las principales motivaciones de Gödel para investigar los alcances de los sistemas formales. 2. Para responder a la pregunta acerca de cómo diferenciar entre sí la verdad y la demostrabilidad, Gödel debió idear una manera de expresar la metateoría de un sistema formal en el sistema formal mismo. Por ejemplo, el teorema G2 hace referencia a una fórmula C que enuncia la consistencia de M ¿Cómo puede ser esto? ¿Cómo puede una fórmula aritmética expresar la consistencia de un sistema formal? Esto lo aclararemos posteriormente. Por ahora lo único que podemos decir es que Gödel descubrió un camino para traducir diversos enunciados pertenecientes a la metamatemática en enunciados aritméticos, siendo uno de ellos el que afirma la consistencia de M. Dado que el sistema M permite la formalización de la aritmética, el enunciado en cuestión se puede expresar mediante una fórmula C que, como Gödel demuestra, no es derivable en M en caso de que el sistema sea consistente. Por consiguiente, M no puede probar su propia consistencia cuando sí lo es. la forma en que se construyen los enunciados A y ¬A, es muy fácil darse cuenta cuál de ellos es verdadero y cuál es falso, bajo la hipótesis de que el sistema es correcto (o consistente, según sea el caso). 23 Por 266 5. L A INTERVENCIÓN DE G ÖDEL 3. Por último, una aclaración. Los métodos de demostración utilizados por Gödel no van más allá de la matemática finitista. Por tanto, los seguidores del programa no pueden descalificar la prueba como “carente de sentido”. 5.2.1. La vía del descubrimiento Antes de examinar con cierto detalle los teoremas de Gödel queremos recorrer el camino que siguió su autor hacia su descubrimiento. Al respecto, en su obra, en las entrevistas y conversaciones que sostuvo con Hao Wang y en la correspondencia dada a conocer de manera póstuma, hay suficiente información como para dar cuenta de lo sucedido.24 Por su propio testimonio, sabemos que en un principio el propósito de Gödel era explorar los alcances del programa de Hilbert.25 Al respecto, las restricciones impuestas por Hilbert le parecieron un tanto arbitrarias, sobre todo el imperativo de que las pruebas de consistencia fueran directas y se llevaran a cabo dentro de los estrechos marcos de la matemática finitista. Claramente, estas limitaciones obedecían al radicalismo de Hilbert y contrastaban con la prueba de consistencia que él mismo había ofrecido para la geometría en 1899, donde se sirvió libremente de las nociones de verdad y modelo, ahora excluidas y vistas con recelo. Al respecto, Gödel decidió abordar la cuestión de la consistencia del análisis desde una perspectiva más abierta, dividiendo el problema en dos partes. En la primera, intentaría una prueba de consistencia relativa para el análisis construyendo un modelo en la aritmética; después, intentaría probar la consistencia de la aritmética de manera absoluta. En este contexto, por “aritmética” lo que Gödel entendía era la aritmética de Peano de segundo orden, en la que también se consideran variables para los conjuntos de números naturales. Gödel pronto se dio cuenta de que para el caso, era indispensable aclarar la relación entre las nociones de verdad y demostrabilidad.26 En la misma carta a Yossef Balas donde se refiere a los “prejuicios filosóficos de nuestro tiempo” (v. sección 5.1.2), 24 Consúltese (Dawson, Jr., 1997), (Gödel, 1995), (Rodríguez, 1994) y (Wang, 1987 y 1996). lo dice en la ya mencionada carta a Yossef Balas (sección 5.1.2), la cual habremos de citar nuevamente en esta sección. 26 En efecto, en un formalismo completo, la noción de demostrabilidad se puede considerar el sucedáneo constructivo de la más bien imprecisa noción de verdad siempre que el sistema sea correcto, es decir, a condición de que sea imposible derivar en él enunciados que bajo su significado usual sean falsos (en realidad, el que un sistema sea incorrecto lo único que muestra es que éste no es una formalización de la teoría en cuestión). Cuando la formalización de una teoría es completa, la noción de “ser una proposición derivable en el sistema” es equivalente a la noción de “ser una proposición verdadera en la teoría” y las nociones son “intercambiables” entre sí. A causa de ello muchos seguidores del programa, dando por descontado que la formalización de la matemática clásica era completa, dejaron de utilizar la palabra “derivable” con relación a los teoremas y se refirieron a ellos como fórmulas verdaderas, pues identificaban la primera noción con la segunda. Uno de ellos, quizá el más notable, fue Herbrand, que vio en la noción de verdad una noción prematemática. Véase al respecto lo dicho en la sección 4.4.2. 25 Esto 5.2. L OS TEOREMAS DE G ÖDEL 267 Gödel explica cómo fue que el problema de la consistencia relativa del análisis lo llevó a considerar la necesidad de definir en la aritmética la noción de verdad para sus enunciados: La ocasión para comparar verdad y demostrabilidad fue un intento por lograr una prueba de consistencia relativa del análisis en la aritmética. Esto nos lleva casi por necesidad a tal comparación. Pues un modelo aritmético del análisis no es otra cosa que una ∈-relación aritmética que satisface el axioma de comprensión: ∃n∀x(x ∈ n ↔ A(x)) Ahora, si en la fórmula anterior “A(x)” se reemplaza con “A(x) es derivable,” tal ∈-relación se puede definir fácilmente. Por tanto, si la verdad fuera equivalente a la derivabilidad, habríamos alcanzado la meta. Sin embargo (y éste es el factor decisivo) de la solución correcta a las paradojas semánticas se sigue que la “verdad” de las proposiciones de un lenguaje no puede ser expresada en el mismo lenguaje, mientras que la derivabilidad (siendo una relación aritmética) sí puede. Ergo verdadero ≡ derivable.27 Aclaremos lo dicho en este pasaje. Denotemos con R el sistema de los números reales, con S la aritmética de Peano de segundo orden, y con LR y LS sus respectivos lenguajes. Un modelo de R en S sería una interpretación de los enunciados de LR en LS en la que los axiomas de R corresponderían a enunciados derivables en S, es decir, se interpretarían como enunciados “verdaderos” según S. Al respecto, una posibilidad era interpretar los números reales como conjuntos de números naturales, y para el caso Gödel consideró los conjuntos definibles, es decir, los subconjuntos X de N para los que hay un predicado aritmético A(x) con la propiedad de que X = {k ∈ N|A(k)}.28 27 Gödel, carta a Yossef Balas, (GN 010015.37, carpeta 01/20) (en la referencia bibliográfica anterior, el código entre paréntesis se refiere a la clasificación de la obra no publicada de Gödel (su Nachlass), la cual se halla en la Biblioteca Firestone de la Universidad de Princeton). La cita fue tomada de (Dawson, 1997), p. 61 y en ella hicimos algunos cambios superficiales en la notación para adecuarla a la utilizada en este texto. 28 Es decir, identificando los números reales con algunos conjuntos de números naturales que se pueden definir mediante un predicado A(x) de LS . Grosso modo, estos conjuntos son los que se pueden precisar enunciando una propiedad que es satisfecha sólo por sus elementos. Algunos ejemplos de conjuntos aritméticos definibles son los siguientes: 1. El conjunto N de los números naturales: N = {x ∈ N|x = x} 2. El conjunto I de los números impares: I = {x ∈ N|∃y(x = 2 · y + 1)} 3. El conjunto Q de los números pares: Q = {x ∈ N|∃y(x = 2 · y)} 4. El conjunto P de los números primos: P = {x ∈ N|x > 1 ∧ ∀y(∃z(y · z = x) → (y = 1 ∨ y = x))} 5. Si p(x) es un polinomio, el conjunto RP de sus raíces enteras no negativas: R p = {x ∈ N|p(x) = 0} En realidad, la mayor parte de los conjuntos considerados en la práctica matemática son definibles, aunque en ocasiones recurrimos a algunos que no lo son, como los que resultan del axioma de elección. 268 5. L A INTERVENCIÓN DE G ÖDEL Ahora bien, como sólo hay un número numerable de fórmulas en LS (pues el lenguaje es numerable), los predicados de LS se pueden poner en correspondencia uno a uno con los números naturales y formar con ellos una sucesión A1 (x), A2 (x), . . . , An (x), . . .. Esta enumeración de los predicados monádicos permite definir una relación aritmética “∈” entre pares de números (uno de los cuales es el índice n) como sigue: k ∈ n ≡de f An (k)29 (5.1) [Paráfrasis: k “pertenece” a n si y sólo si la proposición An (k) es verdadera.] De esta manera la noción de pertenencia a un conjunto quedaría reducida a la noción de verdad relativa a ciertas funciones proposicionales. La conclusión era obvia: para construir el pretendido modelo de R en S era necesario contar en el lenguaje de la aritmética con una definición de la noción de verdad para los enunciados de LS . Al considerar tal posibilidad, Gödel pronto se dio cuenta de que dicha noción no se podía definir en LS , pues de lo contrario se tendría algo semejante a la paradoja del mentiroso y la aritmética sería inconsistente. En la ya mencionada carta a Yossef Balas, Gödel vincula este descubrimiento con el de sus teoremas: “Tiempo antes [del descubrimiento de los teoremas limitativos] había encontrado la solución correcta a las paradojas semánticas en el hecho de que la verdad en un lenguaje no se puede definir en él mismo.”30 Como en seguida veremos, el enunciado indecidible de Gödel se inspira en la paradoja del mentiroso y en la definición de “número richardiano”.31 5.2.2. Una prueba heurística Sin pretensión de exactitud, las principales líneas de la prueba son las siguientes. Las fórmulas de un sistema formal en su aspecto externo no son sino sucesiones finitas de signos (variables, constantes, conectivas, cuantificadores, paréntesis, etc.), siendo fácil decidir cuáles sucesiones de signos son fórmulas y cuáles no. A su vez, una prueba formal es una sucesión finita de fórmulas con características muy específicas. Para todo propósito metamatemático es irrelevante qué cosas se toman como signos primitivos, así que Gödel elige como tales algunos números naturales. Según esto, las fórmulas 29 Esta relación (5.1) es la señalada por Gödel como una “∈-relación” en la cita anterior. Una lectura de la ∈-relación es la siguiente: paralelamente a la sucesión de predicados A1 (x), A2 (x), . . . , An (x), . . . se define una sucesión de conjuntos C1 ,C2 , . . . ,Cn , . . . con la propiedad de que k ∈ Cn si y sólo si k tiene la propiedad An (x). 30 Gödel, carta a Yossef Balas. Cita tomada de (Wang, 1996, p. 271). Históricamente, quien dio a conocer este resultado fue Tarski en 1933, cuando lo demostró como un corolario al teorema de Gödel, por lo que se le conoce como Teorema de Tarski. Al respecto, ahora sabemos con toda certeza que Gödel lo obtuvo en 1930, precisamente por el camino que ahora explicamos, aunque esto no se hizo público sino mucho tiempo después. De la época sólo se cuenta con una carta de Gödel dirigida a Zermelo, con fecha el 29 de octubre de 1931, en la que expone una prueba exacta de que la verdad en un lenguaje no es definible en él (v. Grattan-Guinness, 1979). 31 Al respecto, véase la sección 3.3. 5.2. L OS TEOREMAS DE G ÖDEL 269 son ahora sucesiones finitas de números naturales, y las pruebas formales sucesiones finitas de sucesiones finitas de números naturales. Para ilustrar lo dicho en el párrafo anterior, en la siguiente tabla sustituimos los símbolos primitivos del sistema AP (apéndice O) con otros símbolos elegidos arbitrariamente (la única condición es que dos símbolos distintos no se sustituyen con un mismo símbolo): ∀ ↓ @ ¬ ↓ # → ↓ $ ( ↓ % ) ↓ & = ↓ ? 0 ↓ ¿ s ↓ * + ↓ ; × ↓ : x0 ↓ - x1 ↓ { ... ... Conforme a este reemplazo, la fórmula “∀x1 ¬(0 = sx1 )” se transforma en la sucesión “@{# %¿?*{&” que, pese a su aspecto poco amigable, posee la misma sintaxis que la fórmula original. En la siguiente tabla hacemos lo mismo, pero esta vez reemplazando los símbolos primitivos de AP con números naturales. La elección es arbitraria. ∀ ↓ 1 ¬ ↓ 3 → ↓ 5 ( ↓ 7 ) ↓ 9 = ↓ 11 0 ↓ 13 s ↓ 15 + ↓ 17 × ↓ 19 x0 ↓ 21 x1 ↓ 23 ... ... Según este segundo reemplazo, la fórmula “∀x1 ¬(0 = sx1 )” se transforma en la sucesión “1, 23, 3, 7, 13, 11, 15, 23, 9” (a la que le hemos añadido comas para separar los números y evitar confusiones). Ahora podemos decir que “1, 23, 3, 7, 13, 11, 15, 23, 9” es un axioma de AP, y quienquiera que conozca el código anterior nos dará la razón. Lo que sigue es una presentación de la prueba de la fórmula “¬(0 = s0)” en cada uno de estos tres modos de escritura. i. ∀x1 ¬(0 = sx1 ) ∀x1 ¬(0 = sx1 ) → ¬(0 = s0) ¬(0 = s0) ii. @{# %¿?*{& @{# %¿?*{& $# %¿?*¿& # %¿?*¿& iii. 1, 23, 3, 7, 13, 11, 15, 23, 9 1, 23, 3, 7, 13, 11, 15, 23, 9, 5, 3, 7, 13, 11, 15, 13, 9 3, 7, 13, 11, 15, 13, 9 Para sólo referirse a números naturales (en vez de a sucesiones de números naturales o a sucesiones de sucesiones de números naturales), Gödel ideó un ingenioso procedimiento hoy conocido como “numeración de Gödel”. Dada una sucesión (x1 , x2 , . . . , xn ), ésta 270 5. L A INTERVENCIÓN DE G ÖDEL la codifica en un solo número con base en los primeros n números primos p1 , p2 , . . . , pn de la siguiente manera: g(x1 , x2 , . . . , xn ) = px11 · px22 · . . . · pxnn A este número se le llama “número de Gödel de la sucesión” (la cual puede ser un término o una fórmula de LAP ). Por ejemplo, la fórmula “∀x1 ¬(0 = sx1 )” –que es un axioma– tiene el siguiente número de Gödel: g(1, 23, 3, 7, 13, 11, 15, 23, 9) = 21 · 323 · 53 · 77 · 1113 · 1311 · 1715 · 1923 · 239 En otras palabras, el número (calculado con Mathematica) a = 159, 409, 462, 163, 226, 864, 724, 595, 309, 290, 294, 191, 181, 823, 443, 066, 056, 714, 984, 081, 454, 326, 760, 018, 432, 494, 624, 420, 932, 902, 593, 360, 501, 331, 750 es el número de Gödel de un axioma de AP. Por tanto, ya no carece de sentido decir cosas como “6336091150052786097365181786280684876391574795381620419921 875000 es un teorema de AP” (averigüe usted de qué fórmula estamos hablando). De la misma manera, si a, b y c son los números de Gödel de las tres fórmulas que figuran en la prueba anterior (la de ¬(0 = s0)), entonces el número g(a, b, c) = 2a · 3b · 5c es el número de Gödel de la prueba. Nótese que, conforme al teorema fundamental de la aritmética –según el cual todo número natural se puede descomponer en forma única como un producto de factores primos–, cada número de Gödel tiene una única descomposición de este tipo, lo que nos permite recuperar la sucesión de fórmulas o símbolos y saber qué cosa es lo que codifica tal número. Figura 5.2. La correspondencia de Gödel codifica las fórmulas y las sucesiones finitas de fórmulas como números naturales Con la numeración de Gödel, las proposiciones y los conceptos metamatemáticos se convierten en proposiciones y conceptos relativos a números naturales, o sucesiones de 5.2. L OS TEOREMAS DE G ÖDEL 271 ellos, y son por lo tanto expresables, al menos parcialmente, en el lenguaje de AP. En particular eso se puede hacer con los conceptos de “fórmula”, “prueba”, “fórmula con una variable libre” y “fórmula demostrable”. Por ejemplo, podemos hallar una fórmula teo(x1 ) con una única variable libre x1 que, interpretada a través del código de Gödel, afirma que x1 es un teorema de AP.32 (a) El método de las coordenadas permite traducir enunciados geométricos en enunciados algebraicos (b) La aritmetización permite traducir enunciados metamatemáticos en enunciados aritméticos Figura 5.3. Comparación del método de Gödel con el método de las coordenadas Figura 5.4. Bajo la aritmetización, la relación metamatemática “la fórmula C se deduce de A y B por modus ponens” se convierte en una relación aritmética MP(a, b, c) Supongamos ahora que las fórmulas con una única variable libre x1 se han ordenado de alguna manera, digamos con respecto a sus números de Gödel. Denotemos con An (x1 ) a la n-ésima de ellas. Sea k un número natural. Con k denotamos al término k−veces ssss . . . s 0 32 En otras palabras, el procedimiento recién descrito provee una imagen isomorfa del sistema AP en el dominio de la aritmética, y todos los argumentos metamatemáticos se pueden reproducir (imitar) en esta imagen isomorfa. Esto sucede en la siguiente prueba heurística, donde “fórmula”, “proposición”, “variable”, “prueba”, etc. se deben entender como los correspondientes objetos en la imagen isomorfa (v. gr., la noción de “fórmula” la debemos entender como el correspondiente conjunto de números de Gödel). Para ver con claridad cómo es que esto funciona en un caso muy simple, en el apéndice P expresamos la metateoría del sistema AB del apéndice L en la aritmética (recursiva) a través de su codificación. 272 5. L A INTERVENCIÓN DE G ÖDEL que representa al número k en AP. A este término se le llama numeral de k. Como es habitual, con An (k) denotamos a la fórmula que resulta al sustituir en An (x1 ) todas la presencias libres de x1 con k. Si bien aquí no lo probaremos, la operación metamatemática anterior, consistente en substituir en la n-ésima fórmula de la lista anterior todas las presencias libres de x1 con el numeral de k, es definible en AP. Con base en lo anterior podemos ver que el conjunto K = {x ∈ N|AP Ax (x)} es definible en LAP , pues todos los conceptos que figuran en el definiens de K son definibles en LAP (v. gr., “ser el resultado de una sustitución, no ser teorema”, etc.)33 Por tanto, existe una fórmula F(x1 ) que, interpretada en cuanto a su contenido, afirma que el número x1 pertenece al conjunto K. Pero F(x1 ), teniendo como única variable libre a x1 , es alguna de las An (x1 ), es decir, hay un g ∈ N tal que F es Ag (x1 ). Figura 5.5. La propiedad de ser un número gödeliano es definible en la aritmética y representable en AP mediante un predicado Ag (x1 ) que figura en la lista Lo que se afirma es que la fórmula Ag (g) es indecidible en AP en caso de que el sistema sea consistente y correcto.34, 35 1. Si Ag (g) fuera derivable en AP, sería correcta, y por lo tanto g pertenecería a K y, por ende, Ag (g) no sería derivable en AP, una contradicción. Por tanto, Ag (g) no es derivable en AP. 2. Si ¬Ag (g) fuera derivable en AP, sería correcta, y por lo tanto g no pertenecería a K y, por ende, Ag (g) sería derivable en AP, de modo que AP sería inconsistente. Por tanto, ¬Ag (g) no es derivable en AP. Conclusión: Si AP es consistente y correcto, ni Ag (g) ni su negación ¬Ag (g) son derivables en él, es decir, Ag (g) es indecidible con base en los axiomas de AP. 33 A los elementos de K se les llama “números gödelianos”. que Ag (g) corresponde a la afirmación metamatemática de que la fórmula Ag (g) no es derivable en AP, aseverando de este modo su propia indemostrabilidad. 35 El sistema es correcto cuando todos sus teoremas son verdaderos bajo la interpretación usual. 34 Nótese 5.2. L OS TEOREMAS DE G ÖDEL 273 Es claro que una prueba rigurosa de este resultado no se puede apoyar en la hipótesis de que el sistema es correcto, pues se trata de una noción semántica que no tiene sentido para los seguidores del programa de Hilbert. Esto se puede evitar a cambio de complicar el argumento. Al respecto, el lector podrá acudir a las muchas pruebas que hay del primer teorema de incompletud de Gödel en la literatura. El enunciado de Gödel Ag (g) guarda un estrecho vínculo con la paradoja del mentiroso, pues declara no ser demostrable en AP. En cuanto a la paradoja de Richard, la analogía entre ella y el argumento heurístico de Gödel salta a la vista. Escribamos en paralelo ambos argumentos. Richard 1. Consideremos las frases del idioma español que definen propiedades de los números naturales. Gödel 1. Consideremos las fórmulas de LAP cuya única variable libre es x1 . Cada una de estas fórmulas define una propiedad de los números naturales. 2. Ordénense lexicográficamente las de- 2. Ordénense las fórmulas del inciso anfiniciones: terior conforme a sus números de Gödel: D1 (x) A1 (x1 ) D2 (x) A2 (x1 ) ... ... Dn (x) An (x1 ) ... ... 3. Un número natural k es richardiano si y sólo si “Dk (k)” es falso. De lo contrario, el número k es no richardiano. 4. La definición de richardiano, denotada con R(x), está en algún lugar de la lista, digamos el r-ésimo lugar. En otras palabras, para algún número r, Dr (x) es R(x). 3. Un número natural k es gödeliano si y sólo si AP Ak (k). De lo contrario, el número k no es gödeliano. 4. Hay una fórmula Ag (x1 ) en la lista con la siguiente propiedad: 1. Si k es gödeliano, entonces AP ¬Ag (k) y 2. Si k no es gödeliano, entonces AP ¬Ag (k). 5. Supongamos que Dr (r) es verdadero. En tal caso r no es richardiano (pues no cumple con la definición de este concepto) y Dr (r) es falso (pues Dr (x) define la propiedad de ser richardiano). 5. Supongamos que AP Ag (g) En tal caso el número g no es gödeliano y, por (4b), AP ¬Ag (g). Por tanto, dado que AP es consistente, AP Ag (g). 274 5. L A INTERVENCIÓN DE G ÖDEL 6. Supongamos Dr (r) es falso. En tal caso r es richardiano (pues cumple con la definición de este concepto) y Dr (r) es verdadero (pues Dr (x) define la propiedad de ser richardiano). Conclusión: Dr (r) es verdadero si y sólo si Dr (r) es falso. 6. Supongamos que AP ¬Ag (g). Dado que AP es consistente, AP Ag (g). Por tanto, g es gödeliano y, por (4a), AP ¬Ag (g). Por reducción al absurdo en la metateoría, AP ¬Ag (g). Conclusión: Si AP es consistente, entonces AP Ag (g) y AP ¬Ag (g), es decir, Ag (g) es indecidible y AP es incompleto. El argumento de Gödel es aplicable no sólo al sistema AP, sino a cualquier sistema S que contenga una formalización de la aritmética recursiva. Un paso fundamental en la adaptación del argumento de Richard consiste en cambiar la noción de verdad por la de demostrabilidad. Con ello la paradoja desaparece, pero no las sorpresas: con rigor matemático, Gödel demuestra que la completud es inalcanzable. Sin abundar demasiado en los detalles diremos que en su prueba Gödel dejó atrás todas las dificultades que agobian al argumento de Richard como, por ejemplo: ¿Cómo saber qué frases del idioma español definen propiedades de los números naturales? ¿Cuál es el criterio para saber si una propiedad P(x) definida en el lenguaje natural es verdadera o falsa acerca de un número k? Con relación al sistema AP las objeciones anteriores se desvanecen: La idea de “frase del idioma español que define una propiedad de los números naturales” se cambia por la noción exacta de “fórmula de LAP con una variable libre”. La idea de “proposición aritmética verdadera” se cambia por la noción exacta de “fórmula derivable en AP”. La conclusión alcanzada por Gödel no es una contradicción, pero sí un hecho sorprendente: el sistema AP no puede ser consistente y completo a la vez. Muchas fueron las cuestiones técnicas que Gödel debió resolver: ¿Qué propiedades de los números naturales, definidas en el metalenguaje, son representables en el sistema?, ¿cómo referirse en LAP a sus propias fórmulas?, ¿cómo obtener una fórmula autorreferente en LAP ? Al respecto, lo mínimo que debería esperarse de un sistema de esta naturaleza es que en él pudieran representarse todas las funciones, propiedades y relaciones recursivas de los números naturales. Esta exigencia se satisface plenamente a partir de sistemas incluso más débiles que AP. 5.2. L OS TEOREMAS DE G ÖDEL 5.2.3. 275 La cuestión de la autorreferencia Gödel logra la construcción del enunciado autorreferente Ag (g) mediante el método de la diagonal de Cantor y una función recursiva especial a la que en breve nos referiremos. De hecho, la definición de número gödeliano se apoya en el método de la diagonal. Formemos un arreglo bidimensional de substituciones (una matriz infinita) con todas las fórmulas que tienen a x1 como única variable libre, como en la siguiente tabla: A1 (x1 ) A2 (x1 ) A3 (x1 ) ... An (x1 ) ... 1 A 1 ( 1)) A2 (1) A3 (1) ... An (1) ... 2 A1 (2) A 2 ( 2)) A3 (2) ... An (2) ... 3 A1 (3) A2 (3) A 3 ( 3)) ... An (3) ... ... ... ... ... ... ... ... n A1 (n) A2 (n) A3 (n) ... A n ( n)) ... ... ... ... ... ... ... ... En la fila superior se enumeran las expresiones de LAP que representan a los números naturales (los numerales), y en la columna a la izquierda las fórmulas que tienen a x1 como única variable libre, ordenadas conforme a sus números de Gödel. Para cada n y cada k, en la intersección de la fila n con la columna k se tiene la fórmula An (k), la cual “dice” que el número k tiene la propiedad An . La definición de número gödeliano resulta al recorrer el arreglo a lo largo de la diagonal, pues en ella se pide que la fórmula Ak (k) no sea derivable en AP: una aplicación del método de la diagonal de Cantor. Al respecto, Gödel probó (y no sólo supuso, como Richard) que entre las fórmulas An (x1 ) figura una, la Ag (x1 ), con las características señaladas en el inciso (4) del comparativo entre los argumentos de Richard y Gödel. Lo anterior constituye una de las principales tareas en la demostración de su teorema de incompletud. El enunciado autorreferente Ag (g) resulta al sustituir en la fórmula Ag (x1 ) la variable x1 con el numeral g. Cabe señalar que la autorreferencia se logra en estos casos sin la utilización de pronombres o datos empíricos como, por ejemplo, referencias espaciales o temporales, o referencias a una ubicación, como cuando se dice “el primer enunciado de la introducción a la Crítica de la razón pura es falso”. En vez de ello Gödel se sirve de algo que no se ve en la prueba heurística: de una función recursiva especial, la función sb(x, v, nml(z)) que podemos describir como “substituir en la fórmula x todas las presencias libres de la variable v por el numeral de z”, donde v es el número de correspondencia de una variable. Por ejemplo, recordando que 21 es el número de correspondencia de x0 , si a = g(x1 < x0 ), entonces sb(a, 21, nml(2)) = g(x1 < ss0). Con base en esta función, la autorreferencia se logra de la siguiente manera. Se considera la fórmula ¬∃xPR(x1 , sb(x2 , 25, nml(x3 ))) (5.2) donde PR(x, y) es un predicado de prueba para AP (el cual corresponde a la relación “x es el número de Gödel de una prueba de la fórmula con número y”) y 25 es el número 276 5. L A INTERVENCIÓN DE G ÖDEL de correspondencia de x2 . La fórmula (5.2) se puede interpretar como diciendo que cierta fórmula no es demostrable, a saber, aquélla que resulta de la fórmula con número x1 al sustituir en ella todas las presencias libres de la variable x2 con el numeral de x3 . Nótese que en este caso la referencia no se da mediante pronombres o datos empíricos, sino detallando las operaciones sintácticas que se han de realizar con los símbolos y las expresiones de LAP para obtener la fórmula en cuestión. Consideremos ahora una variante de la fórmula (5.2), en la que la variable x3 se substituye con la variable x2 (diagonalización): ¬∃xPR(x1 , sb(x2 , 25, nml(x2 ))) (5.3) Se trata nuevamente del método de la diagonal de Cantor. En (5.3) se pide que la variable x2 (es decir, la variable cuyo número de correspondencia es 25) se substituya con el numeral de x2 , i. e., con el “número” de la fórmula a la que se le aplica el proceso de substitución. Si g es el número de Gödel de la fórmula (5.3), el enunciado de Gödel se obtiene realizando la substitución x2 /g: ¬∃xPR(x1 , sb(g, 25, nml(g))) (5.4) Ahora leamos la fórmula (5.4) como un enunciado que incluye las instrucciones necesarias para obtener la fórmula a la que se refiere (el sujeto de la ‘oración’). Nos dice: “Tómese la fórmula con número de Gödel g y substitúyanse en ella todas las presencias libres de la variable x2 con el numeral g,” y continúa: “la fórmula así producida no es derivable en AP (no es un teorema de AP)”. Si realizamos las operaciones indicadas, lo que resulta es precisamente la fórmula (5.4). Es justo en este sentido que el enunciado de Gödel es autorreferente, pues a través del código afirma su propia indemostrabilidad en AP. En la siguiente tabla mostramos cómo se utiliza el método de la diagonal de Cantor para obtener esta clase de enunciados. 1 2 ... n ... 1 sb(1, 25, nml (1)) sb(2, 25, nml(1)) ... sb(n, 25, nml(1)) ... 2 sb(1, 25, nml(2)) sb(2, 25, nml (2)) ... sb(n, 25, nml(2)) ... ... ... ... ... ... ... n sb(1, 25, nml(n)) sb(2, 25, nml(n)) ... sb(n, 25, nml (n)) ... ... ... ... ... ... ... Cuadro 5.1. Aplicación del método de la diagonal para obtener una fórmula autorreferente Con el paso del tiempo, el método de la diagonal y la posibilidad de la autorreferencia se convirtieron en un venero de resultados en la lógica y la teoría matemática de la computabilidad. Todo ello originado en las paradojas. Por ejemplo, con base en las 5.2. L OS TEOREMAS DE G ÖDEL 277 técnicas introducidas por Gödel y la paradoja del mentiroso, Tarski demostró su famoso teorema acerca de la indefinibilidad de la noción de verdad para los enunciados de la aritmética, del que ya hemos hablado. Grosso modo, el procedimiento es el siguiente. Supongamos que se tiene una fórmula v(x2 ) con la propiedad de que v(k) es verdadera si y sólo si la fórmula con número de Gödel k es verdadera en la aritmética estándar. Consideremos la fórmula ¬v(sb(x2 , 25, nml(x2 ))) (5.5) Supongamos que el número de Gödel de (5.5) es t. Consideremos la siguiente fórmula, la cual a través del código de Gödel emula la frase “Este enunciado es falso”: ¬v(sb(t, 25, nml(t))) (5.6) La fórmula (5.6) simplemente dice: “La fórmula que resulta al substituir en la fórmula (5.5) la variable x2 con el numeral de t no es verdadera”, afirmando de esta manera, y en forma indirecta, su propia falsedad. Ello prueba que tal fórmula no puede existir, es decir, que en el lenguaje de AP no es posible definir la noción de ser un enunciado aritmético verdadero. Si a esto aunamos el hecho de que en LAP es posible definir la noción de ser un teorema de AP con la fórmula teo(z) ≡ ∃xPR(x, z), tenemos la siguiente “desigualdad”: Verdadero = Demostrable Lo anterior significó un duro revés a la pretensión formalista de identificar ambas nociones (v. gr., Hilbert y Herbrand). 5.2.4. Comentarios 1. A diferencia de muchos de sus contemporáneos, que realizaron enormes esfuerzos para evitar las paradojas y las técnicas reflexivas (“Evitando la autorreferencia, se decía, se evitarán las paradojas”), Gödel nos mostró cómo hacer un uso constructivo de las mismas. Fue así que el fenómeno de la autorreferencia, en vez de abandonar el dominio de las matemáticas, se convirtió en una valiosa herramienta de trabajo en los terrenos de la axiomática, los fundamentos de las matemáticas y la teoría matemática de la computabilidad, donde se le ha dado un uso creativo. Podemos decir incluso que en la actualidad el uso de la autorreferencia constituye una fecunda e inagotable estrategia demostrativa. Desde esta nueva perspectiva, lo que se busca con ella ya no es criticar y corregir, o identificar y echar por tierra principios y creencias internamente inconsistentes, sino establecer resultados de manera productiva. Con el paso del tiempo, los métodos y técnicas introducidas han permitido probar diversos teoremas que fijan un límite a (1) el poder de representación de los sistemas formales, (2) el poder expresivo de los lenguajes formales y de programación, (3) el poder y alcance de las máquinas de cómputo 278 5. L A INTERVENCIÓN DE G ÖDEL automatizado y (4) la posibilidad de decidir de manera efectiva diversas cuestiones matemáticas.36 Todo lo anterior ha tenido profundos efectos en la teoría de sistemas, las ciencias de la computación, la inteligencia artificial, la cibernética y, por supuesto, la filosofía y los fundamentos de las matemáticas. Fue así que las técnicas reflexivas de la lógica, utilizadas en un principio de manera informal e inquietante, a la larga revelaron la riqueza que encerraban como procedimientos de argumentación demostrativa, todo esto a partir de los teoremas de incompletud. 2. Los procedimientos recién expuestos proporcionan, para cada sistema formal que satisfaga las referidas hipótesis, un enunciado aritmético que resulta indecidible. No obstante, dicho enunciado no es absolutamente indecidible, pues siempre se puede pasar a sistemas “superiores” en los que se puede decidir (aunque otros enunciados seguirán siendo indecidibles). En particular, resulta que el análisis matemático es, en este sentido, un sistema más elevado que la aritmética elemental, y que el sistema axiomático de la teoría de conjuntos es aun más elevado que el análisis. Por lo tanto, se sigue que hay problemas aritméticos que no se pueden resolver con los métodos de la aritmética elemental, pero sí con métodos analíticos o, respectivamente, conjuntistas. Como veremos, este hecho es muy importante para Gödel, que basa algunos de sus argumentos filosóficos en él. 3. Una idea central en la demostración de Gödel es la de representar en la aritmética formal la metateoría del sistema. Para ello ideó lo que hoy conocemos como método de la aritmetización, que ha sido utilizado en otros dominios. Esta idea de codificar en los números naturales las pruebas formales parte de una simple observación: la de que en el tratamiento formal la naturaleza de los signos considerados es irrelevante, por lo que Gödel decidió que éstos serían números naturales. Esta elección de aparente inocencia encierra una sutileza, casi un contrasentido: según Gödel –y en ello le asiste la razón– la naturaleza de los signos primitivos es irrelevante, por lo que se toma la libertad de elegir como tales a los números naturales, justo aquellos objetos que le permiten traducir la metamatemática a la aritmética y que, precisamente por ello, hacen de la elección algo relevante. Una consecuencia de lo anterior es que cuando un sistema formal contiene una formalización de la aritmética, una parte de su metateoría se puede formalizar en él. Fue esta idea de formalizar la metamatemática, desdeñada o ignorada por Hilbert, lo que abrió todo un mundo de posibilidades al momento de investigar los alcances de las teorías axiomáticas. 4. Un elemento central en la prueba de Gödel es la construcción del enunciado Ag (g), que a través del código afirma su propia inderivabilidad. El caso es que bajo 36 Al respecto, el lector podrá consultar los siguientes textos: (Kleene 1952 y 1967), (Rosser 1936), (Ladriere 1959), (Church 1936), (Turing 1937), (Post 1941 y 1947), (Rogers 1987), (Mostowski 1952), (Skolen 1920), (Rice 1953), (Wang 1993) y (Uspenski 1987). 5.2. L OS TEOREMAS DE G ÖDEL 279 consistencia, este enunciado es inderivable en el sistema. Esta situación encierra algo más. Si bien Ag (g) no es derivable en AP, este hecho puede ser reconocido por un observador externo. Claro está que para quien razona dentro del sistema la verdad o falsedad de Ag (g) es inaccesible, pues los medios demostrativos a la mano no le permiten decidir la cuestión. No obstante, para el observador externo la disparidad entre las nociones de verdad y demostrabilidad formal se hará evidente al momento de demostrar la consistencia del sistema.37 Esta situación es, además, irremediable, pues el punto es que la verdad del enunciado de Gödel no se puede determinar trabajando dentro del sistema.38 Esta situación es extensible a todos los sistemas y a todos los enunciados de este tipo. 5. El primer teorema de Gödel trata de hecho con la no contradicción. Lo que en él se demuestra es que la aritmética no puede ser consistente y completa a la vez, (es decir, que la aritmética o es inconsistente, o es incompleta). Surge entonces la pregunta sobre cómo probar que un sistema formal es consistente, y éste es el tema del segundo teorema: si un sistema formal X contiene a la aritmética elemental, entonces es imposible probar con los recursos disponibles en X la consistencia de X, de la misma manera en que la verdad del enunciado G no se puede probar dentro de AP.39 Las pocas demostraciones conocidas de este segundo teorema tienen como base el hecho de que el enunciado G es en sí mismo un enunciado de consistencia, pues afirma la existencia de un enunciado que no es derivable en el sistema (a saber, él mismo), lo cual equivale a afirmar que el sistema es consistente.40, 41 37 La situación ante la que nos coloca el enunciado de Gödel es aun más delicada: A (g) es verdadero g si y sólo si es inderivable, de modo que su derivabilidad lo hace falso, y su inderivabilidad, verdadero. Al comparar el enunciado de Gödel (“este enunciado es inderivable”) con la paradoja del mentiroso (“este enunciado es falso”), Howard DeLong, no sin cierto sentido de humor, comenta que en el enunciado de Gödel “el mentiroso ha desaparecido, pero como el gato Cheshire, su sonrisa perdura.” (Cita tomada de DeLong, 1971, p. 162). Ciertamente, en lo que podemos calificar como un acto prodigioso, Gödel bordea la paradoja del mentiroso sin caer en contradicciones, hasta alcanzar conclusiones de muy largo alcance. 38 Obviamente, para saber que el enunciado es verdadero el observador tiene que establecer la consistencia del sistema. No obstante, para Hilbert y Gödel nada hay que cierre el paso a esta eventualidad, pues consideran que en la matemática no hay tal cosa como problemas irresolubles. Por ejemplo, en 1936 Gentzen probó que el sistema AP es consistente; esto con base en un argumento no más complicado que los que de ordinario se presentan en la matemática clásica. A este punto volveremos en la siguiente sección, pero algo debe quedar en claro desde ahora: la disparidad entre verdad y demostrabilidad es un hecho, incluso si como observadores no tenemos a la mano ninguna prueba de la consistencia del sistema en cuestión. 39 En realidad, Gödel jamás exhibió una prueba de este último resultado, sino que se limitó a observar su cumplimiento. Por ejemplo, en su famoso artículo de 1931 lo único que ofrece es un bosquejo de este teorema, con la promesa de que en un futuro cercano dará una prueba rigurosa del mismo. No obstante, la pronta aceptación de sus resultados le hizo postergar indefinidamente esta cuestión, y nunca cumplió lo prometido. 40 Como sabemos, un sistema formal de este tipo es consistente si y sólo si hay una fórmula A de su lenguaje que no es derivable en él., 41 Grosso modo, una demostración del segundo teorema de Gödel –relativa al sistema AP de la sección anterior–, iría como sigue. Constrúyase una fórmula C que formalice la afirmación de que AP es con- 280 5. L A INTERVENCIÓN DE G ÖDEL 6. En la actualidad las antinomias se dividen en dos clases: lógicas y semánticas. Las primeras, ejemplificadas por la paradoja de Russell, no hacen referencia a la verdad o falsedad de las expresiones, mientras que las segundas, ejemplificadas por la paradoja del embustero, hacen referencia a los predicados verdadero y falso con relación a un cierto lenguaje L. Al primer tipo pertenecen las paradojas de Burali-Forti, Cantor, Russell, del barbero, del catálogo de catálogos y del alcalde, citadas en la sección 3.3, mientras que al segundo pertenecen las paradojas de Epiménides, de la impredicabilidad, de Grelling, de Berry y la de Richard, citadas ahí mismo. Grosso modo, la solución de las paradojas semánticas consiste en reconocer que nociones como la de “ser un enunciado verdadero de L” no se pueden expresar en L. Si acaso, ésta se ha de definir en un segundo lenguaje L que haría las veces de metalenguaje respecto a L. Digamos que la definición de tales nociones tiene que ser externa al lenguaje y no se puede usar dentro de él. En cuanto a los lenguajes formales la situación es un poco más precisa, pues en algunos casos se ha podido demostrar que la noción de verdad relativa a sus enunciados no es definible en ellos mismos, como en la aritmética. 7. Históricamente, Gödel fue el primero en valerse de las paradojas semánticas para establecer hechos de limitación para los lenguajes y los sistemas formales. En el caso de la aritmética la consecuencia fue el descubrimiento de que las nociones de verdad y demostrabilidad formal no son equivalentes entre sí, pues la primera no es definible, mientras que la segunda sí lo es. Esta imposibilidad de definir la noción de verdad para los enunciados de un lenguaje dentro del lenguaje mismo servirá de apoyo a nuestras conclusiones en la sección 7.2. 8. En ([Wang, 1996, p. 242) podemos hallar dos comentarios hechos por Gödel en los que explica cómo fue que el descubrimiento de los teoremas limitativos dependió de su objetivismo. Esto sirve como anticipo a lo que veremos en el capítulo 6. La numeración es la de Wang. 7.4.16 Finalmente deberíamos notar que el principio heurístico de la construcción de proposiciones aritméticas indecidibles en el sistema formal sistente. Una posibilidad es, por ejemplo, formalizar el siguiente enunciado metateórico: “no hay una fórmula A tal que A y ¬A son derivables en AP”. Con base en un complicado argumento metamatemático se puede probar que los enunciados C y G son equivalentes entre sí según AP (recordemos que G denota al enunciado indecidible Ag (g)), es decir, que las fórmulas C → G y G → C son derivables en AP, de modo que cualquier prueba de C conduciría directamente a una prueba de G (es decir, se tendría que AP C → G, y AP C, por lo que con una sola aplicación del modus ponens se tendría que AP G, lo cual es imposible en conformidad con el primer teorema de incompletud). Dado que el enunciado G no es derivable en AP en caso de que AP sea consistente, de lo anterior se sigue que el enunciado C tampoco es derivable en AP. Por tanto, el sistema formal AP no es capaz de probar su propio funcionamiento consistente. 5.3. L OS TEOREMAS DE G ÖDEL EN NUESTRO TIEMPO 281 para la matemática es el concepto altamente transfinito de “verdad matemática objetiva”, como algo opuesto al de “demostrabilidad”, con el que se le confundía a menudo antes de mi trabajo y el de Tarski. A su vez, el uso de este concepto transfinito lleva eventualmente a resultados demostrables finitariamente, como por ejemplo a teoremas generales acerca de la existencia de proposiciones indecidibles en sistemas formales consistentes. 7.4.17 Una nota semejante es aplicable al concepto de verdad matemática, donde los formalistas consideraban la demostrabilidad formal como un análisis del concepto de verdad matemática y, por lo tanto, no estaban en posibilidad de distinguirlas entre sí. Con estos comentarios damos por finalizada la prueba heurística de los teoremas de Gödel. Esperamos haber transmitido con claridad las ideas en que se basa la prueba y la forma de sus argumentos. En la exposición hemos evitado en lo posible entrar en la abrumadora cantidad de detalles técnicos sobre los que descansa la verdadera prueba de los teoremas, detalles que, en su mayor parte, consisten en mostrar cómo se codifican las reglas de inferencia del sistema en la aritmética, cómo se representa el manejo de los axiomas mediante operaciones aritméticas, y cómo se construye el enunciado indecidible de manera efectiva. No obstante, tales elementos son hasta cierto punto innecesarios para apreciar la estructura y el sentido de la prueba.42 5.3. Los teoremas de Gödel en nuestro tiempo Sin lugar a dudas, los teoremas de incompletud de Gödel fueron los resultados más notables de la lógica matemática en el siglo veinte. Su aparición no sólo transformó la lógica moderna, sino que nos forzó a repensar la naturaleza de la matemática, trayendo consigo un efecto renovador para su filosofía. Su autoría confirió a Gödel un lugar muy especial entre los matemáticos de todos los tiempos, llevando a pensadores como Willard van Orman Quine a referirse a él como “el descubridor de la verdad matemática más significativa del siglo veinte.” Esta opinión fue compartida por John von Neumann, quien en 1951 se refirió a la obra de Gödel con las siguientes palabras: “Lo logrado por Gödel en la lógica moderna es singular y monumental –de hecho es algo más que un monumento, es un hito que permanecerá visible a lo lejos en el espacio y en el tiempo [. . . ] El tema de la lógica ciertamente ha cambiado por completo su naturaleza y posibilidades con los logros de Gödel.”43 42 Si el lector busca una exposición rigurosa del primer teorema de incompletud de Gödel, podrá acudir a cualquiera de siguientes fuentes: (Gödel, 1986, pp. 144-196), (Heijenoort, 1967, pp. 592-617), (Mendelson, 1979, cap. 3) y (Enderton, 1972, cap. 3). 43 Estas palabras las pronunció von Neumann en la ceremonia de entrega del premio Einstein a Kurt Gödel y Julian Schwinger. 282 5. L A INTERVENCIÓN DE G ÖDEL Más allá de la matemática, la obra de Gödel se ha hecho presente en nuestra cultura de diferentes maneras, desde la filosofía hasta la literatura y el arte, pasando por las ciencias sociales. Esto no podría ser de otro modo, dada el determinante papel que juega la ciencia en general y la matemática en particular en nuestra visión del mundo.44 El mismo Gödel consideró en repetidas ocasiones las implicaciones filosóficas de sus teoremas de incompletud, centrándose más que nada en la filosofía de la mente y en la defensa del realismo matemático, una dirección en la que apuntan, según él, los teoremas limitativos (esto lo veremos más adelante). No debemos olvidar que muchas cuestiones que Gödel aborda han sido motivo de grandes debates, como la de si hay preguntas que la mente humana jamás podrá responder.45 También está su realismo conceptual, según el cual los objetos abstractos de la matemática no sólo existen por sí mismos, sino que la mente humana puede entrar en contacto con ellos, o la compleja relación (acentuada por sus teoremas) entre diversos elementos que claramente se articulan en la matemática (v. gr., la lógica, la intuición, el lenguaje y el pensamiento), y que por analogía se puede extender a otros ámbitos de lo humano. La consideración de todo esto y las distintas conclusiones alcanzadas (o que algunos creen alcanzar) han influido en la manera como percibimos la realidad en general y nuestro entorno en particular, obligándonos a reconsiderar nuestra visión no sólo de las matemáticas sino del mundo, como en su momento lo hicieran el sistema heliocéntrico de Copérnico, la física de Newton, la teoría de la evolución de Darwin, la teoría de la relatividad, la física cuántica o la genética molecular. Un claro ejemplo de la trascendencia de la obra de Gödel en otros dominios lo tenemos en la filosofía de la mente, donde sus teoremas limitativos se han utilizado de diversas maneras, o en la curiosidad que han despertado en zonas tan distantes como la música o el arte. Por ejemplo, J. R. Lucas inicia con las siguientes palabras un polémico artículo que titula “Las mentes, las máquinas y Gödel”: “Tengo la impresión de que el teorema de Gödel demuestra que el mecanicisimo es falso, es decir, que las mentes no pueden ser explicadas como las máquinas” [Lucas, 1964]. En la poesía se cuenta con un homenaje a Gödel (“Homage à Gödel”) de Hans Magnus Enzenberg, en la música con un concierto para violín (2o concierto de Hans Werner Henze), en el teatro con una obra de Daniel Kehlmann (Ghosts in Princeton), así como citas y referencias en películas, obras de teatro y novelas. En la literatura latinoamericana Jorge Volpi Escalante (México) y Guillermo Martínez Corino (Argentina) han escrito sendas novelas inspiradas también en la obra de Gödel, las cuales han sido premiadas 44 La importancia de la matemática en nuestra cultura la expresa Morris Kline con las siguientes palabras: “[. . . ] la civilización occidental actual se distingue de cualquier otra conocida en la historia por el grado en que la matemática ha influido la vida y el pensamiento contemporáneos.” (Kline, 1980, p. 12). 45 Otra razón por la cual Gödel ganó popularidad fuera de las matemáticas fue el examen que realizó de la posibilidad de que el universo sea rotatorio, de modo que en él haya líneas cerradas de tiempo a través de las cuales los objetos pueden evolucionar hacia su propio pasado. Esto último, arguye Gödel, significaría que las propiedades “esenciales” del tiempo (linealidad, irreversibilidad, etc.) no estarían fundadas en nuestras leyes fundamentales del tiempo y el espacio, por lo que el tiempo sería algo ilusorio (subjetivo) en este sentido. 5.3. L OS TEOREMAS DE G ÖDEL EN NUESTRO TIEMPO 283 y traducidas a diversas lenguas.46 Otro ejemplo es el de la escritora y filósofa norteamericana Rebecca Goldstein, quien al discurrir en torno al significado de los teoremas de Gödel, la teoría de la relatividad de Einstein y el principio de incertidumbre de Heisenberg, juzga que todos ellos han constituido verdaderos cataclismos que han sacudido los fundamentos de las ciencias calificadas por ella como “exactas”. Es entonces que, de manera enfática, expresa el desconcierto que tales cosas le producen: “Estos tres descubrimientos parecen enviarnos a un mundo desconocido, uno tan en desacuerdo con nuestras suposiciones e intuiciones previas que, casi un siglo después, todavía estamos luchando para distinguir en dónde exactamente es que hemos aterrizado.” Más allá del tono desbordado con que se expresa Goldstein (¿acaso ochenta o cien años no le parecen suficientes para cambiar de paradigma?), o de los desacuerdos que podamos tener con su postura, su punto de vista refleja en gran medida lo que en la literatura no científica o estrictamente filosófica se piensa o ha pensado de los teoremas de Gödel, es decir, del impacto que estos han tenido fuera de los círculos científicos.47 Algo semejante ocurre con Sigfrido Samet Letichevsky, quien al referirse a creencias tales como “el conocimiento es acumulativo (es decir, una vez adquirido, éste es definitivo)”, “el Universo es determinista (y por lo tanto eterno)”, “el tiempo es absoluto y constante”, “la aritmética es completa, coherente y acabada” –todas ellas heredadas del siglo diecinueve– escribe: “En el siglo XX se demostró la falsedad de todas estas creencias. Los teoremas de Gödel y el Principio de Indeterminación de Heisenberg pusieron en evidencia las limitaciones de 46 Las novelas son En busca de Klingsor de Jorge Volpi (Editorial Seix Barral, 1999) y Crímenes imperceptibles de Guillermo Martínez (Editorial Planeta, 2003). En ambos casos hay abiertas referencias a los teoremas de Gödel, que en parte sirvieron como venero de tales obras. Volpi menciona directamente el libro Gödel, Bach, Escher, an Eternal Golden Braid de Douglas R. Hofstadter como una fuente de inspiración. En cuanto a Guillermo Martínez, podemos citar el siguiente pasaje de su obra, en la que realiza una sugerente trasposición literaria de los teoremas de Gödel. Se trata de un pasaje en el que uno de los personajes reflexiona en torno a la posibilidad de probar culpabilidades o inocencias cuando se investiga un crimen: Demasiadas veces las evidencias que se encuentran no alcanzan para probar ni la culpabilidad de uno ni la inocencia del otro. En el fondo, lo que mostró Gödel en 1930 con su teorema de incompletitud es que exactamente lo mismo ocurre en la matemática. El mecanismo de corroboración de la verdad que se remonta a Aristóteles y Euclides, la orgullosa maquinaria que a partir de afirmaciones verdaderas, de primeros principios irrebatibles, avanza por pasos estrictamente lógicos hacia la tesis, lo que llamamos, en una palabra, el método axiomático, puede ser a veces tan insuficiente como los criterios precarios de aproximación de la justicia. Lo que el autor pone en la palestra es la falibilidad de conocimiento humano (su “incompletud”) y la deficiencia de toda investigación, pues generalmente a lo que se arriba es a “un conocimiento probable, indemostrable e incompleto” en palabras de Gioconda Marín, uno de sus personajes. 47 Rebecca Goldstein ha intentado difundir por diversos medios (libros, artículos, entrevistas, videos) las ideas y los teoremas de Gödel, así como discurrir en torno al significado de sus teoremas. Su obra más conocida es un libro publicado en 2005 bajo el título Incompleteness, The Proof and Paradox of Kurt Gödel (W. W. Norton & Company, New York). Una crítica a las imprecisiones del libro desde la óptica de la lógica matemática y la filosofía la podrá encontrar el lector en una excelente reseña escrita por Juliette Kennedy, publicada en la revista Notices of the AMS, Volume 53, Number 4, pp. 448-455. La cita la hemos tomado de las páginas 21-22 del libro de Rebecca Goldstein. 284 5. L A INTERVENCIÓN DE G ÖDEL la capacidad humana de captar la realidad.” (Véase [Samet, 2002]). Se trata, digamos, de una lectura típica de los teoremas limitativos en el ámbito de la filosofía. Cosas similares se han intentado en el terreno de las ciencias sociales, aunque de manera mucho más incierta o francamente inaceptable. Al respecto, en el apéndice Q, titulado “Usos y abusos de los teoremas de Gödel” examinamos, en un tono más bien burlesco, un par de intentos recientes por extrapolar en forma indebida los resultados de Gödel a dominios como los de la política y las ciencias jurídicas. Concluimos esta sección con algunos comentarios. 1. En el pasaje anterior hemos visto cómo los teoremas de incompletud suelen relacionarse con el principio de incertidumbre de Heisenberg. Al respecto, en el libro “A Profile of Mathematical Logic” de Howard De Long, podemos hallar una prudente reflexión de la que a continuación presentamos un breve resumen.48 DeLong inicia señalando una obviedad: con relación a los productos de la imaginación, siempre habrá cuestiones indeterminadas. Por ejemplo, no tiene sentido preguntarse por el número de veces que Romeo y Julieta estornudaron durante su no muy larga vida. Algo semejante podemos decir con relación a muchas de nuestras imágenes de la realidad (el recuerdo de una escena, un retrato, etc.) Por otra parte, podemos pensar que la realidad física es determinada (Newton y Einstein lo creían). En contra de lo anterior, la mecánica cuántica sugiere que la realidad física está indeterminada de cierta manera o, para ser más claros, que nuestra relación con la realidad no nos permite responder cierto tipo de preguntas. Y así como la teoría cuántica puso al descubierto cierto grado de indeterminación en la naturaleza, los teoremas limitativos lo hicieron con relación a la matemática. En este sentido De Long los equipara con el descubrimiento de la inconmensurabilidad del lado de un cuadrado con su diagonal, que derribó una concepción de las matemáticas con hondas raíces históricas. Conforme a la concepción abatida por Gödel, la teoría aritmética, si no es que ya era completa, se podría completar (es decir, se podría elaborar una teoría aritmética sin faltantes). Pero lo que Gödel demostró fue lo contario: que la teoría aritmética no sólo es incompleta, sino incompletable, que ningún extensión consistente de ella puede alcanzar la saturación. Volviendo a la indeterminación, ésta se debe en este caso a nuestra incapacidad de establecer un conjunto de supuestos básicos suficientes para decidir todas las interrogantes aritméticas. Para cada conjunto de principios coherentes habrá cuestiones que parecerán accidentales, pues no seremos capaces de probar con base en ellos su verdad aunque así parezca (digamos, verificando una multitud de casos particulares, como hasta ahora ha sucedido con la conjetura de Goldbach). Y así como nuestra percepción sensorial tiene límites que podemos extender pero no eliminar, nuestra concepción abstracta de la serie numérica también tiene límites que podemos extender pero no eliminar. 48 Véase, DeLong, 1970, p. 201 y ss. 5.3. L OS TEOREMAS DE G ÖDEL EN NUESTRO TIEMPO 285 Digamos que nuestro poder de discriminación conceptual no está menos limitado que nuestra discriminación sensible.49 Naturalmente, todas estas cuestiones son controversiales, y no pueden ser abordadas con el mismo rigor o claridad que una teoría matemática. Nuestra intención es clarificar algunos puntos y estimular el interés por ellos, sin pretender alcanzar conclusiones con la precisión de una demostración matemática.Naturalmente, todas estas cuestiones son controversiales, y no pueden ser abordadas con el mismo rigor o claridad que una teoría matemática. Nuestra intención es clarificar algunos puntos y estimular el interés por ellos, sin pretender alcanzar conclusiones con la precisión de una demostración matemática. 2. En virtud de algunos comentarios que hemos hecho en esta sección y en el apéndice Q, pudiera parecer que nuestra opinión es que los teoremas de Gödel no se pueden utilizar seriamente fuera de la matemática misma. Esto no es verdad. Más bien, tales comentarios los hicimos con el propósito de advertir que al utilizar estos teoremas hay que proceder con prudencia, sin que ello signifique una prohibición. Como bien lo señala Hao Wang, los teoremas de Gödel ocupan un importante lugar en muchos debates filosóficos, permitiéndonos esclarecer –así como problematizar– la ya mencionada relación entre la lógica y la intuición, la forma y el contenido, lo mental y lo mecánico, el lenguaje y el pensamiento, la verdad y la demostrabilidad, lo real y lo cognoscible.50 3. Más allá de la filosofía de la matemática, otro tipo de especulaciones filosóficas asociadas a los teoremas de Gödel han sido las relacionadas con los intentos por mostrar que el poder la mente humana es superior al de cualquier mecanismo o sistema formal. El primero en considerar eso que podemos llamar el “argumento gödeliano contra el mecanicismo” fue Alan Turing en los años cuarenta y cincuenta, si bien con la intención de refutarlo (véase (Piccinini, 2003)). Al respecto, en una exposición de los teoremas de Gödel –(Nagel & Newman, 1958)– los autores llegan erróneamente a la conclusión contraria a la de Turing, también sobre la base de los teoremas de Gödel. Poco tiempo después J. R. Lucas intentó lo mismo en el artículo ya mencionado de 1961. Recientemente, Roger Penrose ha hecho reclamos similares en (Penrose, 1990 y 1994), en el sentido de que los teoremas de 49 Obviamente, este argumento supone una postura realista (platónica), pues se habla de la serie numérica como existente por sí misma, con independencia de las concepciones humanas de ella. No obstante, en la práctica matemática así funcionan las cosas, salvo por los formalistas radicales y los constructivistas, cuyos “protomártires” datan a los más del siglo XVIII. La visión usual (espontánea, cándida) del matemático afanado en los problemas de su ciencia, desde siempre ha sido mayoritariamente realista, con un fuerte núcleo de realidad aritmética donde cualquier enunciado escrito en los términos de la teoría es verdadero o falso. No es el momento de discutir si las cosas son en verdad así, sino el de reconocer que así se presentan en la práctica. Basta para ello escuchar una conversación entre dos colegas matemáticos. A este punto volveremos más tarde. 50 Wang, 1996, p.3. 286 5. L A INTERVENCIÓN DE G ÖDEL Gödel implican, sin restricciones, que la mente humana sobrepasa infinitamente el poder de cualquier máquina finita. El problema es que los argumentos de Penrose contra el mecanicismo, al igual que los de Lucas y los de Nagel y Newman, están viciados, cosa de la que nos ocuparemos más adelante. 4. En cuanto a la divulgación de las ideas de Gödel y la exploración del significado y alcances de sus teoremas limitativos, todo ello dedicado a un público más amplio, queremos mencionar un libro lleno de viveza: Gödel, Bach, Escher, an Eternal Golden Braid de Douglas Hofstadter. Este libro, como ningún otro, ha contribuido a divulgar las ideas que rodean a los teoremas limitativos no sólo de manera lúdica, imaginativa y amena, sino sin faltar mayormente al espíritu de los mismos. Al respecto, en el apéndice Q el lector hallará un amplio comentario del mismo. 5. Los teoremas de Gödel en tanto que pruebas de imposibilidad. En su libro A Logical Journey. From Gödel to Philosophy, Hao Wang enuncia cuatro formas alternativas del primer teorema de incompletud de Gödel, adoptando cuatro perspectivas diferentes. El lenguaje utilizado es más impreciso que el de los textos de lógica matemática, pues se trata de lecturas lindantes con la filosofía: a) Ningún sistema formal para las matemáticas puede ser consistente y completo a la vez. b) Toda teoría axiomática formal para la matemática clásica contiene por fuerza proposiciones indecidibles. c) Ninguna computadora que demuestre teoremas podrá producir todas las proposiciones matemáticas verdaderas y ninguna falsa. d) La matemática es inexhaustible (incompletable) mecánicamente. Si bien el sentido de cada una de estas formulaciones es diferente en cada caso, todas ellas reflejan una misma idea: la de que hay ciertas tareas imposibles de realizar. Algo similar hace Gödel al decir, con base en sus teoremas, que ningún matemático puede escribir axiomas que contengan a toda la aritmética elemental, ni puede establecer una prueba de consistencia de la aritmética –o cualquiera de sus extensiones– al interior de ella misma. Es así que los teoremas de Gödel penetran en la esencia de dos de las ideas más antiguas de la matemática: el sistema de los números naturales y el método axiomático, ambas presentes en la matemática griega. Al hacerlo, marcan dos metas inalcanzables, dos cosas que ningún matemático podría lograr. Dicho en otras palabras, establecen un límite a nuestras capacidades. Este carácter los inscribe en una clase muy especial de proposiciones matemáticas, conocidas como teoremas de imposibilidad. Se trata de resultados negativos que establecen que ciertos problemas no se pueden resolver de la manera esperada. 5.3. L OS TEOREMAS DE G ÖDEL EN NUESTRO TIEMPO 287 Los resultados de esta clase han ocupado desde siempre un lugar muy especial en la ciencia en general. Veamos cómo se expresa Oskar Morgenstern con relación a su naturaleza y significado: Aunque algunos de los más profundos descubrimientos que ha logrado la mente humana se han expresado en forma negativa, es extremadamente peligroso discutir límites en forma categórica. Tales resultados son que no puede haber un móvil perpetuo, que no se puede superar la velocidad de la luz, que el círculo no se puede cuadrar con regla y compás, que no todo ángulo se puede trisecar, y así sucesivamente. Cada una de estas afirmaciones es la culminación de un enorme esfuerzo intelectual. Todas ellas se basan en siglos de trabajo y descansan en una evidencia empírica masiva o en el desarrollo de nuevas matemáticas, o en ambas cosas. Aunque establecidos en forma negativa, estos y otros casos son enormes logros positivos y grandes contribuciones al conocimiento humano. Todos comprenden razonamientos matemáticos; algunos pertenecen, en verdad, al dominio de la matemática pura que abunda en proposiciones acerca de prohibiciones e imposibilidades.51 La primera prueba matemática de una imposibilidad en la historia fue la de la inconmensurabilidad de la diagonal de un cuadrado√con su lado, lo cual se expresa en lenguaje moderno diciendo, en particular, que 2 no se puede escribir como un cociente de la forma p/q, con p, q ∈ N. Esto lo hicieron los pitagóricos alrededor del año 500 a. e., instituyendo con ello un tipo de prueba que ganó fama a finales del siglo XVIII cuando Gauss probó la imposibilidad de construir ciertos polígonos regulares con regla y compás. Posteriormente el siglo XIX fue testigo de cómo la matemática se entregó a la producción de teoremas de esta naturaleza. Ejemplo de ello son la imposibilidad de resolver mediante radicales la ecuación de quinto grado y la imposibilidad de probar el quinto postulado de Euclides con base en los primeros cuatro, lo cual dejó tras de sí una estela de asombro y fascinación. En el siglo XX este modo de abordar los problemas adquirió grandes proporciones, multiplicándose los resultados de este tipo en áreas como la geometría, el álgebra, la teoría de conjuntos, las ciencias de la computación e incluso las ciencias sociales (v. gr., el Teorema de la imposibilidad de Arrow). Al respecto, los teoremas limitativos de Gödel se hallan entre los resultados más prominentes de este tipo. Un rasgo sorprendente es que, a diferencia de otros resultados de esta índole, el primer teorema de Gödel puso en duda una suposición compartida prácticamente por todo el mundo: que tarde o temprano, todo problema aritmético se podría resolver (positiva o negativamente) al interior de la teoría. Esta creencia fue sacudida precisamente por dicho teorema. Esto no lo podemos decir de otros casos del mismo género. Por ejemplo, no todo el mundo esperaba poder resolver la ecuación de quinto grado aplicando las 51 Oscar Morgenstern, “Limits of the uses of mathematics in economics”, texto de una conferencia que pronunciara el 4 de enero de 1963 en un simposio organizado por la American Academy of Political and Social Sciences de los Estados Unidos. Disponible en Internet en https://www.princeton.edu/ ~erp/ERParchives/archivepdfs/M49.pdf 288 5. L A INTERVENCIÓN DE G ÖDEL operaciones de suma, resta, multiplicación, división y extracción de raíces a sus coeficientes. No se sabía si esto se podía o no se podía hacer. En este sentido, lo que vino a hacer el Teorema de Abel-Ruffini fue a disipar la duda, sin provocar por ello una conmoción. En las siguientes secciones veremos más que nada las implicaciones de los teoremas de Gödel con relación a la matemática y, en particular, al programa de Hilbert. 5.4. Los teoremas de Gödel, el programa de Hilbert y las matemáticas 5.4.1. Consecuencias para la filosofía y el programa de Hilbert Regresemos al programa de Hilbert. Como sabemos, éste tenía como propósito responder ciertas preguntas relativas a diversas teorías formales que representan fragmentos o, quizá, la totalidad de la matemática clásica. Lo que se buscaba era probar su consistencia y determinar si eran completas y decidibles. Para responder a tales interrogantes fue que Hilbert ideó la teoría de la demostración. Hacia 1930 ninguna de estas cuestiones había recibido respuesta, aunque en opinión de Hilbert éstas serían favorables respecto a la aritmética de Peano y la matemática clásica, con la posible excepción de la completud en el último caso.52 Curiosamente, Hilbert no consideró necesario formalizar la metamatemática, de modo que ésta no fue investigada, manteniéndosele dentro de la esfera de la argumentación intuitiva en vez de ser tratada en pie de igualdad con la matemática propiamente dicha.53 A la distancia, esta fase del formalismo se contempla como un tanto ingenua, acrítica y desatenta a sus propias limitaciones. Y si bien en este período se introdujeron algunas técnicas y conceptos básicos que aún tienen vigencia, en él también se trazaron metas imposibles de alcanzar y que sirvieron como estímulo para las investigaciones. Como hemos visto, fue Gödel quien puso fin a este periodo, conduciendo la teoría de la demostración a un nivel más crítico y reflexivo. Desde un punto de vista muy general lo que Gödel nos reveló fue una matemática abierta, incompleta e incompletable, en vez de una ciencia concluida y cerrada en sí misma. Se requieren pocas palabras para decirlo y muchas para comprenderlo. Al respecto, en las siguientes secciones habremos de abundar en el tema de la consistencia, la completud y la conservatividad, dejando de lado por el momento la cuestión de la decidibilidad y la resolubilidad de todo problema matemático, que trataremos más adelante. 52 Esto se entrevé claramente en los planteamientos que hace en [Hilbert, 1928]. solía referirse a la matemática finitista con el término inhaltlich, es decir, de contenido, lo cual es un indicativo de que jamás consideró formalizarla. 53 Hilbert 5.4. L OS TEOREMAS DE G ÖDEL EL PROGRAMA DE H ILBERT Y... 5.4.2. 289 La cuestión de la completud Para precisar nuestro punto de vista conviene destacar algunos aspectos del programa de Hilbert. Como sabemos, el propósito inicial era probar la consistencia de la matemática clásica con base en la matemática finitista, para lo cual había que reducir la primera a un sistema de axiomas construidos en un lenguaje sintáctico muy preciso, junto con una lista de reglas de inferencia de corte finitista. Ahora bien, la reducción de la matemática clásica a un “juego formal de signos”, un eslogan muy utilizado en su tiempo, constituiría en sí misma un sólido fundamento en el que toda referencia a objetos infinitos y todo uso de hipótesis no declaradas (que pudieran llevar a paradojas) quedaba eliminado. Brouwer denominó “formalismo” a este movimiento, un término que después se siguió utilizando para referirse a la escuela asociada al programa de Hilbert. El nombre no fue casual; más bien, dejaba ver la intención que se hallaba detrás de tales esfuerzos: sustituir la noción de verdad con la de demostrabilidad. En otras palabras, el programa buscaba sustituir las nociones semánticas implicadas en la matemática clásica con nociones sintácticas. Es por ello que el punto de vista que Hilbert adopta en el programa se puede calificar como reduccionista o nominalista: pretende reducir la matemática a un conjunto de convenciones sintácticas.54 Decir que los teoremas de Gödel plantearon un serio reto al programa de Hilbert es una forma muy diplomática de decir que lo demolieron. Estamos conscientes de que son muchos los que pretenden poner en tela de juicio esta última opinión, escudándose en argumentos cada vez más rebuscados. No obstante, si miramos las cosas desde la óptica de la práctica matemática, poco es lo que se puede decir en defensa del programa. El proyecto de Hilbert simplemente se derrumbó. Esto se hará evidente en las siguientes secciones. Nuestro interés por ahora es presentar, en contra de las metas que Hilbert persigue, un argumento más cercano a la filosofía, y por ende menos preciso. Supongamos una teoría formal T que contiene una formalización de la aritmética recursiva y que es consistente (AP es una de ellas, ZFC es un fuerte candidato). Si adoptamos una postura filosófica moderada, según la cual el enunciado de Gödel GT para la teoría T es absolutamente significativo, entonces el primer teorema de Gödel lo que nos dice es que no hay un sistema axiomático fijo capaz de probar todos los enunciados verdaderos de este tipo.55 Es decir, no podemos caracterizar la noción de “enunciado aritmético verdadero” con un conjunto de convenciones sintácticas. Se trata 54 También Gödel sostiene que el punto de vista de Hilbert en el programa es una forma de nominalismo (un caso extremo de creacionismo) [Véase Wang, 1996, p. 77]. El nominalista considera que la matemática consiste solamente de convenciones sintácticas y sus consecuencias, y esto es lo que pretende hacer Hilbert con la matemática clásica. Es por ello que Gödel también se refiere a la postura de este último como “la concepción sintáctica de la matemática”. 55 Esta postura es sumamente razonable. El enunciado indecidible corresponde (conforme al código de Gödel) a una afirmación relativa a las pruebas formales en el sistema, y se puede probar equivalente a un enunciado que afirma que cierto programa de cómputo P no se detendrá al ser puesto en marcha con ciertos datos iniciales (Programa = Máquina de Turing, una noción que pronto veremos) ¿Cómo sostener que un enunciado acerca del comportamiento de una máquina específica no es significativo? 290 5. L A INTERVENCIÓN DE G ÖDEL de una especie de obviedad: un sistema no puede probar demasiadas cosas acerca de sí mismo sin caer en contradicciones. Éste es el sentido de la incompletud cuando se acepta un mínimo razonable de cosas significativas, lo cual, comparado con lo que se puede observar en la práctica matemática, no es pedir demasiado. Por tanto, sin ir demasiado lejos en cuanto al sentido que le damos a las fórmulas, podemos ver que la reducción propuesta por Hilbert es ilusoria. Siempre habrá alguna verdad que escapa al sistema. La formalización sólo es posible de manera parcial, no total. Ciertamente, Hilbert contempló también la posibilidad de formalizar gradualmente la matemática clásica, añadiendo en forma progresiva nuevos principios con la consiguiente prueba de consistencia (¡ah, y de la consistencia hablaremos en la siguiente sección!). No obstante, esta posibilidad no contemplaba a la aritmética elemental, cuya completa formalización se consideraba casi un hecho a partir de los axiomas de Peano. Ahora sabemos, a la luz del primer teorema de Gödel, que el ideal de caracterizar formalmente la noción de “enunciado aritmético verdadero” no es alcanzable. Pero éste era justamente uno de los propósitos de la formalización. Esto lo dejó ver Gödel ya en 1930 en una reunión donde dio a conocer su teorema de incompletud: “Bajo el supuesto de la consistencia de la matemática clásica, se pueden dar ejemplos de proposiciones [. . . ] que son en realidad no vacuamente verdaderas, pero indemostrables en el sistema formal de la matemática clásica”.56 Es más, dependiendo de lo que se entienda por aritmética finitista, el primer teorema de Gödel puede muy bien significar que ni siquiera la noción de “verdad” correspondiente a este fragmento de la matemática clásica se puede formalizar por completo. Al respecto, la discusión de lo que se entiende por “aritmética finitista” la postergamos a la sección 5.4.5, donde abordamos el tema del instrumentalismo matemático. Por ahora sólo diremos que en la actualidad el consenso está dividido: algunos consideran que la aritmética finitista no va más allá de la aritmética recursiva primitiva, mientras que otros sostienen que ésta incluye todas las fórmulas aritméticas de una clase muy especial denotada con el símbolo Π01 , cuyos elementos poseen una estructura relativamente simple. De ser así, el enunciado de Gödel GT para cada teoría T del tipo especificado sería finitista, de modo que la aseveración inicial de este párrafo sería correcta. Con relación a este modo de leer el primer teorema de Gödel, escuchemos la manera en que Hao Wang lo enuncia en un lenguaje más cercano a la filosofía que a la lógica: la matemática es inexhaustible. Por su parte Gödel ofrece la siguiente formulación: “La mente humana no puede formalizar todas las intuiciones matemáticas.” El sentido de esto último es el siguiente: al formalizar nuestras intuiciones matemáticas, junto con el formalismo aparece una nueva intuición que lo trasciende, a saber, el enunciado de Gödel GT . Obviamente, estamos asumiendo que T es consistente, pues si no lo fuera la teoría no tendría ningún valor. Es más, con el paso del tiempo la comprensión de los enunciados indecidibles se refinó a tal punto que ahora sabemos que ni siquiera es 56 La cita aparece en [Wang, 1987, p. 138 de la traducción al español]. La reunión era un foro de discusión sobre los fundamentos de la matemática presidido por Hans Hahn en el marco de un coloquio sobre la epistemología de las ciencias exactas celebrado en Königsberg, Prusia Oriental, en 1930. 5.4. L OS TEOREMAS DE G ÖDEL EL PROGRAMA DE H ILBERT Y... 291 posible incorporar como teoremas todas las fórmulas verdaderas acerca de ecuaciones diofánticas. Esto lo veremos en las siguientes secciones. Como quiera que sea, no será sino hasta la sección 5.4.5 que ofrezcamos firmes razones para decir que el primer teorema de Gödel basta para rebatir el programa de Hilbert. Para concluir queremos reiterar que el primer teorema de Gödel es muy claro respecto al programa de Hilbert: simplemente, no se puede determinar un sistema formal que sea completo ni siquiera para la aritmética elemental, ya no digamos para la matemática clásica o la teoría de conjuntos. La matemática queda abierta hacia arriba: una vez alcanzado un mínimo de poder expresivo, ésta se halla en vías de construcción en cualquier momento de su desarrollo, sin la esperanza de llegar nunca a su culminación: siempre se podrán añadir nuevos postulados, pero nunca los suficientes como para concluir la labor axiomática. A esto es a lo que se refiere Hao Wang cuando expresa el primer teorema de Gödel diciendo que “La matemática es inexhaustible (incompletable) mecánicamente”. 5.4.3. La cuestión de la consistencia A pesar de su trascendencia, el primer teorema de Gödel no fue lo que echó por tierra la pretensión de “eliminar en forma definitiva el problema de los fundamentos de las matemáticas”, tantas veces proclamada por Hilbert. De ello se ocupó el segundo teorema. Es muy probable que la matemática clásica sea consistente; de hecho, es sobre esa creencia que edificamos la teoría. No obstante, su consistencia no ha sido probada, y, lo que es peor, jamás lo será mediante un argumento que tenga cabida en ella. En este sentido, la matemática clásica mira su propia consistencia como un misterio, como un enigma imposible de resolver, y sólo un observador externo podría, si acaso, ofrecer una prueba deductiva de la misma, aunque con medios de prueba ajenos y tal vez más dudosos que los codificados en ella. Frente a esto, tenemos que destacar que la solución esperada por Hilbert al problema de la consistencia apuntaba precisamente en la dirección contraria. Desde su punto de vista, las teorías matemáticas habrían de formar una especie de pirámide en cuya base se encontraría aquella formada por los elementos más simples: la matemática finitista. Esta base serviría como punto de partida para asegurar la consistencia de toda la construcción. Así, por ejemplo, la aritmética finitista probaría la consistencia de la aritmética de Peano, y una vez probada la coherencia de ésta última se le podría utilizar para probar la consistencia de, digamos, la teoría de conjuntos sin el axioma de elección, para a su vez utilizar esta teoría en una prueba de consistencia de la teoría de conjuntos con el axioma de elección, etc., de modo que cada vez que se hubiera probado la consistencia de un nivel, lo habido en él se podría utilizar para asegurar la consistencia de los subsiguientes niveles, cada vez más complejos. 292 5. L A INTERVENCIÓN DE G ÖDEL Figura 5.6. Pirámide de Hilbert No obstante, en vista del teorema de Gödel sabemos que la situación es la opuesta. En efecto, si “acabar” un sistema significa probar su consistencia, es imposible contentarse con las suposiciones que en él se hacen (no basta considerar el sistema a la luz de sus métodos y principios), pues éstas son insuficientes para probar su consistencia: hay que hacer la siguiente suposición. Para continuar con la metáfora diremos que la imagen de la pirámide debe ser invertida, ya que para consolidar un “piso” ¡es necesario construir el siguiente! (para validar un sistema, hay que validar el sistema que formaliza la prueba de su consistencia). En tal caso la base de la pirámide se encontraría suspendida en la cúspide, una cúspide inconclusa por sí misma, y que debe ser elevada sin cesar. Figura 5.7. Pirámide invertida después de Gödel Si, como pretende Hilbert, fundamentar la matemática consiste en probar su coherencia lógica de manera elemental (pues sólo así tendría algún valor epistemológico la prueba), la matemática se fundamenta en la nada. Concluimos este apartado con algunos comentarios de carácter general. 1. Retomando la terminología adoptada en la notal al pie 54 de la sección 5.4.2, podemos decir que fue el segundo teorema de Gödel lo que echó por tierra el programa de Hilbert, pues “la consistencia de las convenciones sintácticas va más allá de las convenciones mismas.” Sólo un finitista contumaz (digamos: Gentzen, 5.4. L OS TEOREMAS DE G ÖDEL EL PROGRAMA DE H ILBERT Y... 293 o el mismo Hilbert) podría imaginar la posibilidad de una prueba finitista de consistencia para la matemática clásica, es decir, imaginar que la matemática finitista, yendo más allá de las convenciones adoptadas, por ejemplo, en un sistema como ZFC, podría probar la consistencia de este sistema. Esto no nos parece creíble. Ahora bien, dado que esto no es un certamen de creencias sino un debate, hay todavía una objeción a dicha postura: el que todas las intuiciones utilizadas en la prueba de consistencia se podrían formalizar e integrar a la matemática, de modo que aparecería un segundo sistema, digamos ZFC+ , en espera de su consiguiente prueba de consistencia, etc. de modo que la matemática permanecería por siempre abierta, incompleta e incompletable, siempre en construcción (como de hecho lo está). 2. Si bien los teoremas de Gödel forman parte de una rama muy especializada de la lógica matemática, y ocupan un lugar de privilegio en áreas como la teoría de la recursión y las ciencias de la computación, su valor los coloca en un plano más allá del interés científico, donde nos revelan su profundo sentido y su innegable valor epistemológico. De alguna manera, los límites que establecen no sólo afectan a los sistemas formales, sino a la razón en general. En una lectura más relajada, el primero de ellos apunta hacia nuestra incapacidad de construir una imagen simbólica del mundo en la que nada falte, o de formalizar cabalmente todo lo que nos es dado en el ámbito de la intuición; el segundo, irónicamente llamado “de la consistencia”, nos muestra que la razón matemática, y por ende la razón en general, puede no bastarse a sí misma, pues no logra dar cuenta de la coherencia de los principios adoptados, dejando abierta la posibilidad de que haya problemas que jamás podría resolver. Al respecto, a continuación mostramos una posible conexión entre este resultado y las ciencias sociales. 3. En respuesta a una carta en la que presuntamente le pedían que hiciera un comentario en torno al significado de sus teoremas con relación a las cuestiones humanas, Gödel propuso la siguiente formulación: Una sociedad estrictamente controlada (i. e., una sociedad en la que en todas las cosas se procede con estricto apego a reglas de “conformidad”) será, en su comportamiento, o inconsistente o incompleta, es decir, incapaz de resolver ciertos problemas, quizá de vital importancia. Por supuesto, ambas posibilidades podrían amenazar su supervivencia en una situación difícil. Una observación similar se podría aplicar a los seres humanos en lo individual.57 En este sentido los teoremas de Gödel vendrían a reforzar la idea de que las grandes pretensiones de conocer y vivir en el mundo de acuerdo con una razón 57 Tomado de [Wang, 1996, p. 4]. Según refiere Wang, el texto aparece en un borrador de una carta que Gödel jamás envió a una persona (Wang no recuerda a quién) como respuesta a la pregunta sobre cómo generalizar sus teoremas a las cuestiones humanas. 294 5. L A INTERVENCIÓN DE G ÖDEL autosuficiente, que todo lo abarca, son sólo una quimera. En especial, la confianza desmedida que se ha depositado en diversos sistemas de reglas que guían y justifican nuestra vida individual y social, parece no tener fundamento. Los teoremas de Gödel nos hacen ver que no siempre podemos estar seguros de que nuestras hipótesis son consistentes entre sí, es decir, que nuestras suposiciones constituye un sistema coherente, por no hablar de nuestras creencias, que encierran un mayor grado de vaguedad e inexactitud. Asimismo nos hacen ver que nuestras creencias e hipótesis difícilmente constituirían un sistema completo, en el sentido de contener una respuesta para cada problema. Esta idea la vendrían a reforzar algunos resultados generados en el marco de la teoría de la complejidad, la cual se ocupa, entre otras cosas, de examinar lo que le sucede a la razón en el mundo real, donde se enfrenta a los hechos. 4. Como punto final a lo dicho en esta subsección, escuchemos a Hao Wang: Los teoremas de Gödel asentaron un golpe mortal al programa de Hilbert, el cual es reduccionista y postivista en espíritu: pretende reducir la rica intuición y experiencia matemática a simples conceptos combinatorios mediante pruebas de consistencia de los primeros a través de los segundos. Los teoremas de incompletud no alcanzaron su forma más general en virtud de que el concepto general de procedimiento mecánico no estaba aún disponible en 1931.58 En sus conversaciones con Hao Wang, Gödel expresó cosas semejantes. Por ejemplo, en la página 156 de (Wang, 1996) se halla un pasaje en el que, grosso modo, Gödel dice lo siguiente: Es imposible reconciliar el punto de vista sintáctico con los altos niveles de abstracción que ha alcanzado la matemática moderna tal como se lo propone Hilbert, pues es imposible probar la consistencia de las concepciones sintácticas por mera reflexión en torno a las combinaciones concretas de los símbolos, sin introducir conceptos más abstractos. La alternativa es obvia: Hay que abandonar el punto de vista excluyente hacia la abstracción, o aferrarse a él en contra del espíritu de la época. En otro lugar del mismo libro podemos hallar las siguientes palabras de Gödel: El razonamiento no finitista fue considerado como significativo sólo en la medida en que se le pudiera “interpretar” o “justificar” en términos de la metamatemática finitista. (Nótese que esto, en la mayor parte, ha resultado ser imposible como consecuencia de mis resultados y el trabajo subsiguiente.) Este punto de vista conduce, de manera casi inevitable, a la exclusión del razonamiento no finitario de la metamatemática, pues tal razonamiento, para ser permisible, requeriría de una metamatemática finitista. Pero esto parece una duplicación confusa e innecesaria. [...] La admisión de elementos transfinitos “asignificativos” en la metamatemática 58 Wang, 1981, p 6. 5.4. L OS TEOREMAS DE G ÖDEL EL PROGRAMA DE H ILBERT Y... 295 es incompatible con la idea misma de esta ciencia prevaleciente en la época del programa. Conforme a esta idea, la metamatemática es la parte significativa de la matemática, a través de la cual los símbolos matemáticos (carentes de significado por sí mismos) adquieren un substituto del significado, a saber, sus reglas de uso. Por supuesto, la esencia de este punto de vista es el rechazo de todos los tipos de objetos abstractos u objetos infinitos, los cuales a primera vista son los significados de los símbolos. Es decir, sólo se atribuye significado a aquellas proposiciones que hablan de objetos concretos y finitos, tales como combinaciones de signos.59 Justamente, la pretensión de Hilbert consistía en conciliar los “altos niveles de abstracción que ha alcanzado la matemática moderna” (digamos, en el análisis matemático y la teoría de conjuntos de Cantor) con la matemática finitista mediante la consabida prueba de consistencia, la cual se vio frustrada por los teoremas limitativos. Gödel tenía razón: Los altos niveles alcanzados por la matemática moderna son irreconciliables con el punto de vista sintáctico adoptado por Hilbert. 5.4.4. Gentzen et al Tras la catástrofe ocasionada por los teoremas limitativos todo parecía indicar que lo único que quedaba por hacer era finiquitar las investigaciones y marcharse a casa. Parecía como si la teoría de la demostración hubiera fracasado junto con el programa, pues ¿quién iría a estar satisfecho con una justificación de la matemática transfinita de Cantor que desbordara a la teoría cantoriana? Los seguidores del programa adoptaron actitudes que iban desde la incredulidad hasta la resignación. Como ya lo hemos señalado, algunos se negaron a aceptar la imposibilidad de una prueba de consistencia finitista, mientras que otros optaron por modificar el programa renunciando a la pretensión de una prueba absoluta de consistencia, y muchos más decidieron proseguir las investigaciones en torno a los sistemas formales desde una perspectiva matemática, sin ninguna pretensión de fundamentación e incorporando cualquier método que resultara fructífero, incluyendo los procedimientos semánticos. En un principio, el mismo Hilbert se negó a aceptar el segundo teorema de Gödel como algo definitivo, por lo que trató de manejar la cuestión en la aritmética mediante la aceptación de una regla de inferencia con una infinidad de premisas (la regla ω), tratando (paradójicamente) de no alejarse demasiado del constructivismo.60 Al respecto, en la introducción al libro Grundlagen der Mathematik (Fundamentos de las matemáticas), escrito en colaboración con Bernays en 1934 y 1939, Hilbert se expresa con las siguientes palabras: 59 Gödel en [Wang, 1996, pp. 240-241]. En la sección 5.4.5 abordaremos en extenso esta idea de considerar como “asignificativos” los enunciados de la matemática transfinita. 60 Véase el apéndice R. 296 5. L A INTERVENCIÓN DE G ÖDEL Los resultados hasta ahora alcanzados en la teoría de la demostración señalan también la dirección de las subsiguientes investigaciones encaminadas a establecer la consistencia de los métodos matemáticos usuales. Con relación a esta meta quiero enfatizar lo siguiente: el punto de vista, surgido temporalmente, según el cual ciertos resultados de Gödel muestran que mi teoría de la demostración no puede llevarse a cabo, ha probado ser erróneo. De hecho, tal resultado sólo muestra que uno debe utilizar el punto de vista finitista de una manera más aguda con relación a las pruebas de consistencia de más largo alcance [...]61 En su artículo de 1931 Gödel también expresa algunas dudas respecto a si el segundo teorema anula o no la posibilidad de una prueba de consistencia finitista: “Quiero señalar expresamente que el teorema [acerca de la consistencia] no contradice al punto de vista formalista de Hilbert. Dicho punto de vista presupone tan sólo la existencia de una demostración de consistencia en la que nada sino métodos de demostración finitista sean utilizados y es concebible la existencia de una demostración finitista de consistencia que no pueda expresarse en el formalismo P (o M, o A).”62 Si bien el teorema no es concluyente respecto a la imposibilidad de una prueba finitista de consistencia, cabe señalar que los logros en este dominio han sido más bien magros a la fecha (incluyendo el de Gentzen). En todo caso, los debates suscitados se deben a la imprecisión de la noción de prueba finitista y sólo pueden resolverse favorablemente exhibiendo una demostración de consistencia que, aún sin una definición precisa de dicha noción, cumpla a todas luces con las ideas que envuelven al finitismo. En cuanto a Gödel, se puede apreciar en sus escritos posteriores que muy pronto cambió de opinión, como, por ejemplo, en [Gödel, 1931?, 1951 y 1958]. Al respecto, como ya lo hemos dicho reiteradas veces, nuestro parecer es que la matemática finitista no desborda en ningún sentido a la aritmética recursiva primitiva (salvo, quizá, por la inclusión de enunciados Π1 en ella) y que, por lo tanto, no es posible hallar una prueba de consistencia para la aritmética con tales características. Para quienes optaron por modificar el programa de inmediato se planteó el siguiente problema: hallar pruebas de consistencia para la aritmética y algunos fragmentos del análisis que cayeran fuera del formalismo en cuestión, pero que fueran confiables para la mente constructiva. La búsqueda de tales pruebas inició de inmediato. No hubo de pasar mucho tiempo antes de que se hubieran obtenido algunos resultados con relación a la aritmética. En 1936 Gerhard Gentzen (1909-1945), un joven colaborador de Hilbert, logró probar la consistencia de la aritmética de Peano mediante un argumento que no es finitista en el sentido estricto de la palabra, pues en él se acepta como evidente un argumento inductivo que penetra en la segunda clase de los números ordinales de Cantor. Pruebas similares fueron presentadas posteriormente por Ackermann (1940), Lorenzen (1951), Schütte (1951), Gödel (1958) y Hlodovskii (1959). El 61 Hilbert 62 Gödel, y Bernays, 1934, p. vi. 1931. Cita tomada de la traducción al inglés en Heijenoort, 1967, p. 615. 5.4. L OS TEOREMAS DE G ÖDEL EL PROGRAMA DE H ILBERT Y... 297 problema con este tipo de demostraciones es que implican la aceptación de principios más poderosos e inciertos que aquellos cuyo funcionamiento consistente se prueba con ellos. Por ejemplo, la demostración de Gentzen asegura que el principio de inducción finita, fundamental en la demostración de múltiples teoremas de la aritmética y del análisis clásico, es compatible con los demás axiomas de Peano acerca de los números naturales. El problema radica en que la demostración hace uso de una variante un tanto más poderosa del principio de inducción, que lo acepta como válido no sólo para los números naturales, sino para una clase más extensa de números que los contiene como un subconjunto propio: nos referimos a los números ordinales numerables, definidos y estudiados en la teoría transfinita de Cantor y de los que aquéllos no son sino la parte correspondiente a los conjuntos finitos. Si bien tras el segundo teorema de Gödel difícilmente podemos imaginar que las cosas pudieran ser de otra manera, el teorema de Gentzen nos muestra cuál es el mínimo requerido para lograr la demostración de consistencia de la aritmética de Peano, es decir, lo menos que debemos suponer dadas las restricciones impuestas por Gödel. No obstante, desde un punto de vista epistemológico, la demostración no se puede considerar como un fundamento de la teoría, pues en ella se supone algo más poderoso que la inducción finita para “asegurar” a esta última.63 En la actualidad, las pruebas de consistencia constituyen un tema de investigación muy atractivo, dadas las restricciones impuestas por los teoremas de Gödel. Por ejemplo, para quienes se interesan en los fundamentos de la matemática se plantea el problema de investigar si el programa de Hilbert es parcialmente realizable, es decir, de determinar si alguna porción de la matemática transfinita se puede probar consistente mediante una prueba constructiva, cuestión interesante por sí misma. Y si bien la cuestión de la consistencia ha perdido toda su fuerza como vía de validación de las teorías matemáticas, en tanto que problema matemático sigue teniendo vigencia. En otras palabras, si bien después de Gödel las pruebas de consistencia ya no tienen 63 Gentzen no estaba de acuerdo con lo que acabamos de decir. Según él, no podemos descartar la posibilidad de una prueba finitista de consistencia de, digamos, ZFC que no pudiera llevarse a cabo al interior de este sistema, sin que por ello dejara de tener sentido para la mente constructiva. Al respecto, sostiene que las formas de inferencia admisibles en la matemática finitista no pueden caracterizarse concluyentemente (de una vez por todas): “No es posible una delimitación inequívoca [de las formas de inferencia indiscutibles en la aritmética]; no obstante, podemos producir ciertamente argumentos que harán sumamente plausible la admisibilidad de algunos métodos de prueba, aunque la correspondiente justificación fracase para otros métodos en casos donde existe una analogía remota con las falacias que surgen de las antinomias de la teoría de conjuntos, las cuales hacen que estas técnicas parezcan discutibles.” (tomado de Szabo, 1969, p. 158). Este tema sigue siendo motivo de acalorados debates en nuestros días, como el lector lo podrá comprobar, entre otros, en (Baas, 2011), (Detlefsen 1986 y 1990), (Feferman, 2011), (Gödel, 1958), (Raatikainen 2003), (Stenlund, 2012), (Sieg 1984 y 1988), (Szabo, 1969), (Tait 1981, 2002 y 2005) y (Zach 1998, 2001, 2003 y 2005). Al respecto, en el apéndice R el lector hallará un comentario un tanto técnico de la demostración que diera Schütte en 1951 de la consistencia de la aritmética de Peano, la cual no difiere substancialmente de la de Gentzen. Esta prueba nos muestra el avance y el tipo de desarrollos a que condujo el problema de la consistencia en el siglo veinte, siendo dicho resultado quizá el más importante en este renglón. 298 5. L A INTERVENCIÓN DE G ÖDEL ningún valor como fundamento, siguen siendo significativas en la medida en que vinculan los conceptos empleados en la prueba y aquellos envueltos en el sistema formal cuya consistencia se prueba. Como lo señala Hao Wang, es menos confuso y más ajustado a la realidad decir que todas las pruebas de consistencia son pruebas de consistencia relativa, que nos dan información acerca de los métodos de prueba utilizados (v. gr., cuál es el rango mínimo de la teoría de conjuntos que se necesita para probar ciertos teoremas, o qué métodos son necesarios para probar la existencia de cierto tipo de funciones). Lo que sí ya es cosa del pasado es la intención de usarlas como medio de justificación de los principios utilizados. En este sentido, como ya lo hemos señalado, las pruebas de consistencia ya no tienen ningún valor epistemológico. 5.4.5. La cuestión del instrumentalismo Retomemos la cuestión, ya planteada en las secciones 4.2.3 y 4.2.4, de considerar a la matemática clásica como un recurso o método para probar enunciados finitistas. Esto lo propone o sugiere Hilbert en distintas ocasiones, como las siguientes: “En la teoría de la demostración, a los axiomas finitos se añaden los axiomas y fórmulas transfinitos, de manera análoga a como en la teoría de números complejos a los elementos reales se añaden los imaginarios, y a como en la geometría a las figuras reales se añaden las imaginarias. Se puede, en verdad, afirmar que en la teoría de la demostración el éxito de esta manera de proceder es el mismo que en los casos mencionados, a saber: la simplicidad y el carácter deductivamente cerrado de la teoría.”64 “[...] podemos defender perfectamente la idea de que, en realidad, la matemática [clásica] no es sino una especie de aparato que al ser aplicado a números enteros debe proporcionar igualdades numéricas verdaderas. El problema que en ese caso se plantea es el de investigar la construcción de ese aparato hasta el punto en el que toda duda al respecto haya desaparecido.”65 “La extensión por medio de la adición de ideales es lícita y permisible solamente cuando en ella no se provoca el surgimiento de contradicciones en el dominio original, y en consecuencia, únicamente si al suprimir los elementos ideales las relaciones que resultan para los elementos originales son válidas en la esfera original.”66 En la segunda mitad del siglo XX estas afirmaciones dieron lugar a un debate en torno al modo en que Hilbert entiende la maquinaria transfinita: ¿Debemos pensarla tan sólo como un aparato formal que facilita la prueba de enunciados finitistas?, es decir, ¿se 64 Hilbert, 1923. Cita tomada de la traducción al español, segunda edición, p. 138. 1925. Cita tomada de la traducción al español, segunda edición, p. 164. 66 Hilbert, 1925. Cita tomada de la traducción al español, segunda edición, p. 178. 65 Hilbert, 5.4. L OS TEOREMAS DE G ÖDEL EL PROGRAMA DE H ILBERT Y... 299 trata solamente de un instrumento que nos permite probar de manera más eficiente tales enunciados?67 Precisemos el sentido del llamado “instrumentalismo matemático”, con el ojo puesto en la matemática clásica. Según esto, del total de la matemática clásica T sólo una fracción F (la matemática finitista) se considera significativa, mientras que el resto, obtenido mediante la adición de nociones ideales y métodos de demostración que van más allá del finitismo, se ve como un aparato formal que facilita la prueba de fórmulas (enunciados) pertenecientes a F. Para el caso, ni siquiera es necesario suponer que T contiene toda la matemática clásica. Por ejemplo, T podría ser el sistema AP para la aritmética de Peano. Una peculiaridad de este enfoque es que en él no se considera útil o necesario explicar el significado de aquellas partes de T que sobrepasan a F. Lo único que importa es que T sea una teoría conservativa con relación a F, es decir, que cualquier fórmula finitista A demostrable en T también lo sea en F. De ahí el nombre de “instrumentalismo”: la matemática clásica es vista como un instrumento que nos ayuda a acortar o hacer más comprensibles las pruebas de enunciados de F, y nada más.68 La tesis de que la postura de Hilbert en el programa es puramente instrumentalista suele apoyarse también en el siguiente pasaje: De manera análoga a como las operaciones con lo infinitamente pequeño fueron sustituidas por procesos en lo finito con los que podemos llegar exactamente a los mismos resultados y a las mismas y elegantes relaciones formales, debemos ahora reemplazar los modos de inferencia que emplean al infinito por procesos finitos que conduzcan a los mismos resultados, es decir, que nos permitan llevar a cabo las demostraciones a lo largo de las mismas líneas y utilizar los mismos métodos de obtención de fórmulas y teoremas. [...] Esta es la principal intención de mi teoría. Su objetivo es conferir al método matemático la seguridad a la que el periodo crítico del cálculo infinitesimal no pudo llegar.”69 (El subrayado es nuestro). Tal como lo hiciera Bernays en su artículo de 1930 (véase el cuarto comentario al final de la sección 4.2.3), Hilbert sostiene que una prueba de consistencia conlleva la conservación de los enunciados finitistas: “Si uno logra llevar a cabo esta prueba [de consistencia] entonces [...] uno puede asegurar que si un enunciado numérico interpretable finitariamente es derivable en el sistema, entonces éste es siempre correcto.”70 67 Hay incluso un libro dedicado a este tema: Hilbert’s Program: An Essay on Mathematical Instrumentalism de Michael Detlefsen. V. [Detlefsen, 1986]. 68 En la lógica contemporánea, una teoría T se dice que es una extensión conservativa de una teoría F cuando el lenguaje de T es una extensión del de F, todo teorema de F es teorema de T y todo teorema de T que pertenece al lenguaje de F también es teorema de F. Dicho llanamente: la nueva teoría puede que sea más eficiente para probar teoremas, pero no puede probar nuevos teoremas en el lenguaje de F. Nótese que una extensión conservativa de una teoría consistente también es consistente. 69 Hilbert, 1925. Cita tomada de la traducción al español, segunda edición, p. 148-9. 70 Hilbert 1929. 300 5. L A INTERVENCIÓN DE G ÖDEL En lo anterior, “correcto” significa que el enunciado se puede verificar con base en los recursos propios de la aritmética finitista, tal como lo plantea Hilbert en la penúltima cita. En resumen: con relación a estas cuestiones, Hilbert y Bernays creyeron: 1. que una prueba de consistencia aseguraría la “conservatividad” de la teoría ideal (lo cual supone que, de alguna manera, se tiene identificado a qué parte de la teoría formal T corresponde la aritmética finitista, incluyendo los métodos deductivos aceptados en ésta); 2. que la consistencia se podría probar mostrando que toda prueba de una contradicción en la teoría ideal se podía convertir en una prueba finitista de una inconsistencia y, por tanto, 3. que la prueba de consistencia permitiría eliminar cualquier referencia a los elementos ideales en las pruebas de enunciados finitistas. Como a continuación veremos, con base en lo anterior y una aceptable caracterización de los enunciados finitistas, podemos decir que el primer teorema de Gödel es suficiente para refutar el programa de Hilbert. Enunciados finitistas y enunciados ideales. Lo siguiente constituye una extensión de la sección 4.2.3, donde se explica el carácter de la matemática finitista. Una cuestión que se siguió discutiendo en la segunda mitad del siglo XX fue la distinción entre enunciados finitistas y enunciados ideales, la cual no es del todo clara en los escritos de Hilbert y Bernays. Al respecto, una gran mayoría concuerda en que la línea divisoria no va más allá de la aritmética recursiva primitiva tal como se le entiende en (Skolem, 1923). Al respecto, en (Hilbert, 1923), Hilbert propone los siguientes axiomas para la teoría elemental de los números, tomando como soporte el cálculo de proposiciones (axiomas 1-6, no expuestos aquí) y sin especificar aún la maquinaria lógica para la teoría de la cuantificación: III Axiomas de la igualdad 7. a = a IV Axiomas numéricos 9. a + 1 = a 8. a = b → (A(a) → A(b)) 10. δ (a + 1) = a Dice al respecto: “Con base en los axiomas 1-10 es fácil obtener todos los números enteros positivos, lo mismo que las ecuaciones numéricas válidas que a ellos se refieren. A partir de estas bases y haciendo uso de una lógica finitista al realizar consideraciones puramente intuitivas (entre las que, sin duda, hay que contar con la recursión y la inducción intuitiva para totalidades finitas), es posible obtener la teoría elemental de los números.” Hilbert hace la aclaración de que la exposición definitiva de esta teoría 5.4. L OS TEOREMAS DE G ÖDEL EL PROGRAMA DE H ILBERT Y... 301 incluye axiomas para la inducción y definiciones recursivas de la suma, el producto, etc., y que en ella no se recurre a modos de inferencia dudosos o problemáticos. Dice al respecto que todo lo demostrable en este fragmento de la teoría axiomática para los números se puede obtener también sin recurrir a ningún axioma y sin abandonar la esfera del finitismo (es decir, que en este nivel el proceder axiomático es prescindible). La frontera del transfinito se cruza al introducir los conceptos de “todo” y “existe” en forma irrestricta (reléase la sección 4.2.3). Esto sucede, por ejemplo, al introducir principios lógicos como el del tercero excluido para totalidades infinitas, o equivalencias como las siguientes: ¬∀xA(x) ≡ ∃x¬A(x) ¬∃xA(x) ≡ ∀x¬A(x) Se puede pensar que Hilbert dejó claramente marcada la frontera entre lo finitario y lo transfinito con las distinciones que acabamos de ver. No obstante, las cosas no son así. Por ejemplo, hay casos en los que la cuantificación irrestricta no nos “aparta” del finitismo. Eso ya lo vimos en la sección 4.2.3, donde expusimos cómo un enunciado de la forma ∀nA(n) se puede validar finitariamente mostrando que, para cada numeral n, la proposición A(n) es verdadera. Por ejemplo, la proposición ∀n∀m(n + m ≥ n) es finitista. No obstante, Hilbert no es muy claro con relación a esta clase de fórmulas. Como quiera que sea, en la actualidad es común identificar la matemática finitista con la aritmética recursiva primitiva (véase, por ejemplo, Tait, 1981), o, alternativamente –como en Prawitz, 1981–, identificar el conjunto de fórmulas finitistas con una clase especial de fórmulas aritméticas denotada con el símbolo Π01 (o, simplemente, Π1 ) cuyos elementos poseen una estructura relativamente simple. Esta clase pertenece a una jerarquía de conjuntos de fórmulas en la que la base, denotada con Σ0 o Π0 , consiste de todas las fórmulas A en las que ningún cuantificador aparece en forma no acotada. La clase Π1 se halla justo en el siguiente nivel, y consiste de todas las fórmulas B que son lógicamente equivalentes a una fórmula de la forma ∀x1 . . . ∀xn A, donde A es Π0 . Un ejemplo de lo anterior es la fórmula P(x) mediante la cual se define la propiedad de ser número primo: P(x) ≡de f x = 1 ∧ ∀y(∃z(z ≤ x ∧ yz = x) → y = x ∨ y = 1) En breve: aunque no todos están de acuerdo en todos los detalles, lo más lejos que se ha podido llegar al tratar de caracterizar la noción de “fórmula finitista” es que la clase de estas fórmulas (también llamadas “reales” por Hilbert en 1928) –digamos, en el lenguaje de AP o cualquier extensión de éste con símbolos especiales para las funciones recursivas primitivas– está constituida por todas las ecuaciones e inecuaciones numéricas y todas las fórmulas que se pueden obtener a partir de ellas mediante las conectivas lógicas (negaciones, conjunciones, etc.), la cuantificación acotada y la cuantificación universal irrestricta. De ahí la identificación con la clase Π1 .71 71 Cuando Hilbert introdujo la noción de “proposición ideal” en 1925, y cuando introdujo la de “proposición real” en 1928, dio a entender que la parte “real” de la teoría sólo consiste de fórmulas 302 5. L A INTERVENCIÓN DE G ÖDEL Este debate en torno a la matemática finitista tiene importancia en la medida en que Hilbert intenta, vía la teoría de la demostración, basar la matemática ideal en ella. En su opinión no habría otra manera de justificarla, pues “sólo los métodos finitistas nos pueden dar seguridad (Sicherheit)”. En cuanto a la idea de mostrar que la maquinaria de demostración transfinita siempre produce resultados correctos con relación a los enunciados reales, lo ideal habría sido descubrir un método que permitiera convertir toda prueba “transfinita” de un enunciado finitista E en una prueba finitista de E (tal como lo sugiere Hilbert en una de las citas que hacemos al inicio de esta sección). En (Kreisel 1976) el lector hallará una discusión más amplia de esta cuestión. Volviendo al tema que nos ocupa, dos eran las tareas por realizar conforme a lo dicho por Hilbert y Bernays en distintas ocasiones: Por una parte, probar que la extensión de la matemática finitista es consistente; por la otra, probar que dicha extensión es conservativa. Al respecto, es importante notar que la conservatividad de la matemática clásica implicaría su consistencia, pero no a la inversa.72 Si bien algunos autores como Kreisel sostienen que el objetivo principal del programa era establecer la conservatividad de la teoría transfinita con relación a los enunciados finitistas, la realidad es que en el desarrollo del programa Hilbert puso mayor énfasis en la cuestión de la consistencia. Examinemos entonces con mayor detalle la relación entre consistencia y conservatividad, aclarando de paso el vínculo entre esta última y el primer teorema de Gödel. 1. En las fases más avanzadas del programa, Hilbert llegó a imaginar una prueba de consistencia que no sólo establecería la verdad de las fórmulas reales derivables en la matemática transfinita, sino que además proporcionaría un método para generar pruebas finitistas de las fórmulas finitistas (digamos, las pertenecientes a la clase Π1 ) probadas con métodos transfinitos.73 El argumento de Kreisel es que si esto fuera posible, entonces la sola consistencia garantizaría la conservatividad de la teoría transfinita.74 En efecto, supongamos que la matemática transfinita se ha formalizado en un teoría T para la que se tiene una prueba finitista de consistencia. Sea F el fragmendecidibles sin variables libres, pues se supone que estas son “capaces de verificación directa”. Como se puede ver, esta postura no cuenta con aceptación general. Al respecto, el tema sigue siendo motivo de debate, de tediosas “discusiones bizantinas” (¿es más débil la matemática finitista que la aritmética recursiva primitiva?, ¿no lo es?, ¿en qué sentido sobrepasa una a la otra?, etcétera), como el lector lo podrá comprobar en textos como (Detlefsen 1986 y 1990), (Kreisel 1958), (Raatikainen 2003), (Sieg 1984 y 1988), (Smorynski 1988), (Tait 1981 y 2002) y (Zach 2003 y 2005). El debate se debe a la vaguedad con que Hilbert y Bernays explican la noción, la cual parece no admitir una caracterización exacta (cuestión que nos parece irrelevante en cierto sentido). 72 Por ejemplo, al añadir el enunciado de Gödel G como axioma de AP, la extensión sigue siendo consistente, pero no es conservativa con relación a la aritmética recursiva primitiva. 73 Esto lo sugiere, insistimos, en el párrafo subrayado de la cita recién referida, y lo dice abiertamente en (Hilbert 1928, p. 474), si bien no se sirve de la terminología aquí utilizada. Por otra parte, en (Hilbert y Bernays, 1934, pp. 248 y 298) hay una formulación explícita de esta postura. 74 Kreisel, 1960. 5.4. L OS TEOREMAS DE G ÖDEL EL PROGRAMA DE H ILBERT Y... 303 to de T (junto con sus métodos de inferencia) correspondiente a la matemática finitista. El argumento de Kreisel es que la conservatividad de T con relación a F queda garantizada con dicha prueba de consistencia. Veamos. Conforme a la idea del programa, la teoría T debe formalizar todas las proposiciones finitistas “demostrables” en dicho dominio. Esto lo asume tácitamente Hilbert al decir que la matemática transfinita no es sino una extensión no creativa de la matemática finitista, o al proponer la formalización de toda la matemática clásica, la cual incluye a la matemática finitista. Supongamos que la consistencia de T se ha probado finitariamente. Sea A(x1 , ..., xn ) una fórmula aritmética en la que no figuran cuantificadores no acotados (es decir, una fórmula con la propiedad de que ∀x1 . . . ∀xn A(x1 , . . . , xn ) pertenece a la clase Π1 ). Supongamos otras dos cosas: que A(x1 , . . . , xn ) se ha probado en la matemática transfinita, y que para alguna colección de números k1 , . . . , kn , la fórmula A(k1 , . . . , kn ) es falsa. Dado que estamos en la esfera de la matemática finitista (la fórmula A(k1 , . . . , kn ) lo es), y en ella es válida la ley del tercero excluido, concluimos que la fórmula ¬A(k1 , . . . , kn ) es verdadera.75 Pero entonces, por lo dicho en los párrafos anteriores, hay una prueba de ¬A(k1 , . . . , kn ) en la teoría ideal T , pues ésta incluye todos los teoremas pertenecientes a la matemática finitista. No obstante, en T la fórmula ∀x1 . . . ∀xn A es trivialmente derivable de la fórmula A(x1 , . . . , xn ) (por simple generalización), y de ella deriva, por substitución, la fórmula A(k1 , . . . , kn ). Por lo tanto, en T serían derivables tanto ¬A(k1 , . . . , kn ) como A(k1 , . . . , kn ), contradiciendo el hecho de que T es consistente (lo cual se ha probado finitariamente). Ergo la fórmula A(k1 , . . . , kn ) es verdadera. Ahora bien, el argumento anterior es de corte finitista, y con él hemos establecido que, sin importar cuáles sean los números k1 , . . . , kn , la fórmula A(k1 , . . . , kn ) es verdadera, lo cual establece la verdad de la fórmula A(x1 , . . . , xn ). Así, lo que tenemos es una prueba finitista de la fórmula A(x1 , . . . , xn ). Por tanto, T es una extensión conservativa de la matemática finitista con relación a las fórmulas Π1 . Este es, a grandes rasgos, el argumento con que Kreisel demuestra que bajo ciertas condiciones, todas ellas contempladas en el programa, la consistencia finitista de T implicaría su conservatividad con relación a F, claro, bajo el supuesto de que Π1 es la clase de fórmulas fintistas. 2. Si bien casi todos coinciden en que el segundo teorema de incompletud de Gödel refuta definitivamente al programa de Hilbert, las opiniones están divididas en 75 Ni siquiera el intuicionismo pone en duda la validez de la ley del tercero excluido en este dominio, i. e., se trata de algo indubitable con relación a las fórmulas aritméticas puramente numéricas. Dado que en este caso A(k1 , . . . , kn ) es, por hipótesis, falsa, de ello se sigue que su negación ¬A(k1 , . . . , kn ) es verdadera. 304 5. L A INTERVENCIÓN DE G ÖDEL cuanto a la idea de que el primero de estos teoremas también lo hace. Un defensor de esto último es Craig Smorynski,76 quien argumenta lo siguiente: Conforme al análisis de Kreisel (inciso 1 anterior), una prueba de consistencia finitista de la teoría ideal T implicaría la conservatividad de T con relación a la matemática finitista F, en particular con relación a las fórmulas finitistas de la forma A(x) con x libre (fórmulas de la clase Π0 ). Ahora bien, el primer teorema de incompletud de Gödel establece la existencia de un enunciado aritmético GF de la forma ∀xA(x) (con A(x) perteneciente a Π0 ) el cual no es derivable en F en caso de que F sea consistente. Sin embargo, un propósito del programa era construir T de modo que, primero, formalizara a la matemática ideal y, segundo, fuera una extensión de F. Dado que el primer teorema de Gödel forma parte de la matemática finitista, F debería probarlo, es decir, F debería probar la fórmula ConF → GF que lo formaliza (lo que de hecho sucede, por ejemplo, en el caso de AP). No obstante, T probaría también la consistencia de F, i. e., la fórmula ConF y por consiguiente la fórmula GF , de donde se sigue que T no sería conservativa, pues, como lo hemos dicho, el enunciado de Gödel (i. e., GF ) pertenece a la clase Π1 .77 Smorynski concluye que si el propósito del programa era demostrar la conservatividad de la matemática clásica con relación a la aritmética finitista, el primer teorema de Gödel lo refuta.78 Esto se añade a la objeción habitual: si R no puede probar su propia consistencia, ¿cómo podría probar la de T ? Lo que aquí hemos mostrado es sólo un fragmento de un extenso debate en torno al carácter y destino de un programa que para algunos sigue vigente con algunos cambios.79 Por ejemplo, frente a lo anterior Detlefsen argumenta que la conservatividad de la extensión transfinita no es un requerimiento ineludible, ni se sigue necesariamente de lo dicho por Hilbert en sus escritos, por lo que la reemplaza con la más débil condición de consistencia: lo único que se exige es que T sea una extensión consistente de F, es decir, que no pruebe enunciados refutables finitariamente (cosa que, según él, Hilbert admitiría como propósito). Esto explicaría por qué 76 V. Smorynski, 1977. enunciado de la forma ∀xA(x) no es otra cosa que el enunciado Ag (g) de la sección 5.2.2 que también denotamos en esta sección con GF o, en muchos otros lugares, simplemente con G. 78 De hecho, en la actualidad es bien sabido que si T es suficientemente poderosa, puede probar enunciados “reales” que no son demostrables en la subteoría F. Por ejemplo, AP y sus extensiones con relación a la aritmética recursiva. Pese a su importancia no insistiremos en este tema, si bien el mismo habrá de reaparecer en el siguiente capítulo cuando hablemos del punto de vista de Gödel. 79 No para nosotros. Como ya lo hemos dicho, el valor del programa está en otro lugar, no en la promesa de un fundamento basado en las evidencias más simples. Su importancia radica más bien en aquello que nos obligó a pensar en torno a la matemática, en la luz que arrojó en torno a ella, en los desarrollos y resultados a que dio lugar, pero no en la idea de que la matemática es una ciencia cerrada en sí misma. El lector interesado podrá consultar, entre otras, las fuentes ya citadas: (Detlefsen 1986 y 1990), (Franzén, 2005 y 2006), (Kreisel 1958, 1960 y 1976), (Raatikainen 2003), (Sieg 1984 y 1988), (Smorynski 1988), (Tait 1981 y 2002) y (Zach 2003 y 2005). 77 Este 5.4. L OS TEOREMAS DE G ÖDEL EL PROGRAMA DE H ILBERT Y... 305 Hilbert destaca el problema de la consistencia por encima de todo lo demás, y sería compatible con lo que al parecer dijera Gödel alguna vez en una reunión del Círculo de Viena, donde habría expresado sus dudas sobre si “la totalidad de las pruebas intuicionistas se pueden capturar en un único sistema formal”.80 Estas palabras concuerdan con la idea, expresada por él mismo en 1946, de utilizar teorías transfinitas cada vez más poderosas para derivar nuevos teoremas aritméticos (en el siguiente capítulo abordaremos este tema). Por ahora, sólo nos resta insistir nuevamente en que mientras para algunos el finitismo no va más allá de la aritmética recursiva primitiva, para otros se trata de algo abierto a nuevas aprehensiones e intuiciones que lo hacen no formalizable. De esto ya hemos hablado en la sección 5.4.4. Pese a la riqueza y feracidad de los debates en torno al finitismo, continuar con el tema nos alejaría de nuestro objetivo; es más, en nuestra opinión la importancia del tema se ve disminuida por un hecho que nos parece innegable: que los teoremas de Gödel pusieron freno al programa de Hilbert más allá de lo que se diga. Lo demás, pese al valor que pudiera tener para la lógica, la matemática o la filosofía, no está dentro del horizonte de este trabajo.81 5.4.6. Consecuencias para la matemática en general Al reflexionar en torno a los teoremas de Gödel, vemos en ellos algo catastrófico que en su momento vino a malograr uno de los más grandes sueños de la razón matemática, una de sus más ansiadas ilusiones. A finales del siglo diecinueve la base axiomática de la aritmética de los números naturales se forjó bajo la creencia de que la clara comprensión intuitiva de la sucesión numérica, que tanto alabara Poincaré, terminaría por revelarnos todos los mecanismos y reglas que rigen el mundo de los números. Se lograría entonces en la aritmética lo que Hilbert había hecho en la geometría: someter sus razonamientos a reglas puramente mecánicas, de modo que para resolver sus problemas sería suficiente con aplicar servilmente dichas reglas a los axiomas, sin necesidad de saber qué pudieran significar estos. Para ello sólo había una condición ineludible: disponer, como en la geometría, 80 Según Sieg, esto lo habría dicho Gödel en 1931. Al respecto, véase (Sieg 1988, p. 285), donde el autor “reproduce” las palabras de Gödel sin dar ninguna referencia exacta. Respecto a la cuestión de si la matemática finitista es formalizable (un tema ya referido en la sección 5.4.2), nuestra postura es muy clara: ¿Qué podría encerrar la matemática finitista que impidiera su formalización, cuando todos los métodos algorítmicos y constructivos parecen estar englobados en la aritmética recursiva (lo cual cuenta no sólo con una fuerte evidencia empírica, sino con argumentos de mucho peso)? 81 Hay quienes incluso dudan sí en realidad los teoremas de Gödel refutaron definitivamente el programa (v. gr., Raatikainen, 2003). No, la cuestión no encierra ninguna vaguedad: no es posible probar la consistencia de las más importantes teorías matemáticas sobre la base de la evidencia sensible tal y como ésta se presenta en la práctica matemática. Repito: en mi opinión (y muy en contra de lo que algunos autores referidos en la nota al pie anterior), las intuiciones a las que Hilbert hace referencia no son algo misterioso, ni nada que no se pueda o pudiera formalizar, y justo sobre ellas es que Hilbert esperaba fundamentar la matemática, aunque después en su desesperación intentara otros caminos. 306 5. L A INTERVENCIÓN DE G ÖDEL de un cuadro completo de axiomas. Tal parecía que ese cuadro de axiomas era el de Peano o derivaría de él. Curiosamente, Gödel terminó dándole la razón a Poincaré: al reducir la aritmética a una forma vacía, se le mutila. Recordemos las dudas expresadas por este último en 1908, convencido de la riqueza e inexhaustibilidad de nuestra intuición: “Pues bien, lo que quiero averiguar es si es verdad que una vez admitidos los principios de la lógica se puede, no digo descubrir, sino demostrar todas las verdades matemáticas, sin llamar de nuevo a la intuición.” En una lectura más relajada, lo demostrado por Gödel indica que en el dominio de la aritmética todo aquello que podemos calificar como “verdadero” no se puede hacer coincidir con ningún sistema de axiomas y reglas de inferencia. Digamos que niega la posibilidad de una teoría formal que pruebe todas las “verdades” aritméticas, cuyo montaje era la esperanza oculta detrás de la idea de completud. A esto es a lo que se refiere Hao Wang cuando sintetiza el primer teorema de Gödel diciendo que la matemática es inexhaustible. Si partimos de AP, nunca obtendremos la completud, sin importar cómo se extienda el sistema mientras se haga de manera consistente. Por el contrario, en cada uno de los peldaños hacia la completación sólo se tendrá un sistema con limitaciones similares.82 Al respecto, la única alternativa es afinar paulatinamente un cuadro axiomático para la teoría elemental de los números, sin la esperanza de llegar al final. Esto, a pesar de la claridad con que el sistema de los números naturales se presenta ante nuestro entendimiento. Escuchemos a Hermann Weyl: Aunque la idea de un mundo trascendente existente y completo en sí mismo es el principio sobre el que construimos el formalismo, este último en cualquier etapa fija tiene un carácter incompleto, ya que siempre habrá problemas, aun de simple naturaleza aritmética, que pueden formularse dentro del formalismo y verificarse por discernimiento, pero no verificarse por deducción dentro del formalismo. No nos sorprende que un trozo concreto de naturaleza, considerado en su existencia fenomenológica aislada, desafíe nuestro análisis por su inexhaustibilidad y su incompletación; [...]. Pero es sorprendente que algo creado por la mente misma, la sucesión de enteros, la cosa más simple y diáfana para la mente constructiva, tome un aspecto similar de misterio y deficiencia cuando se ve desde el punto de vista axiomático.83 Weyl tiene razón: es sobre la idea de un mundo trascendente que construimos el formalismo bajo la creencia de que podemos formar una imagen (bild) completa de él, es decir, identificar ciertos principios a partir de los cuales se puede inferir todo lo que sucede ahí. El primer teorema de Gödel nos muestra que esta expectativa es errónea: el ideal de la formalización –construir un sistema sintáctico consistente y completo para la aritmética– es inalcanzable. Para Hilbert la frustración fue doble, pues su creencia en 82 Obviamente, algunos enunciados que antes eran indecidibles ya no lo serán, pero siempre habrá alguno que el sistema en cuestión no puede decidir. 83 Weyl, 1949. Cita tomada de la traducción al español, p. 252. 5.4. L OS TEOREMAS DE G ÖDEL EL PROGRAMA DE H ILBERT Y... 307 la resolubilidad de todo problema matemático tendría que aferrarse a otra posibilidad. Así, uno de los propósitos del programa de Hilbert, a saber, construir el equivalente formal de nuestra comprensión intuitiva de los números naturales, no se puede lograr, como tampoco se puede lanzar por la borda “así nomás” la problemática noción de verdad, pues no hay ningún sustituto sintáctico adecuado para ella.84 Claro está que esta lectura de los teoremas de Gödel, junto con la desesperanza que esto pudiera ocasionar, sólo se presenta cuando uno mira la matemática con un ojo puesto en la filosofía, lo cual no siempre es el caso entre los miembros de la comunidad matemática. Al respecto, habría que ver cuál fue o ha sido la respuesta de los matemáticos en activo frente a los teoremas de Gödel. Torkel Franzén sostiene, con justa razón, que lo correcto es pensar que el matemático promedio mira su área como algo completo en algún sentido del término. Si bien esto se puede entender de varias maneras, pensemos que se trata de una especie de completud operativa: cualquier enunciado de la teoría surgido en la práctica se puede decidir por medios matemáticos (el enunciado de Gödel, dirían, no es de este tipo, pues fue construido ad hoc con el propósito de probar la incompletud). Algo semejante a la creencia espontanea en la completud de los axiomas para la aritmética, sobre todo por parte de quienes entienden la inducción como lo hiciera Peano, es decir, como un axioma de segundo orden. Tengo la impresión de que si confrontáramos a este hipotético matemático (inmerso en la práctica cotidiana del álgebra, la geometría, el análisis, la topología. . . La Unión Matemática Internacional considera 97 áreas de investigación), con el tema de la incompletud diciéndole (para usar una expresión de Franzén) “que después de Gödel nuestra disciplina lucha denodadamente en un mar de incompletud” y que muy bien puede suceder que el problema en el que él trabaja sea indecidible en el marco de su teoría, su expresión sería de asombro, como pensando: “¿Cómo es que a este individuo se le pueden ocurrir tales cosas?” Si acaso, respondería que la incompletud es cosa de lógicos y filósofos, no de matemáticos, o tal vez diría: “No sé de qué mar me hablas, lo que sí te puedo asegurar es que yo no nado en él”. Nada importaría entonces que el primer teorema de Gödel indique que en ese bastión supremo de la razón, la matemática, la verdad o bien está más allá de nosotros, o es simplemente algo en lo que nos ponemos de acuerdo, digamos algo consensado antes que una cuestión objetiva. Tampoco serviría de nada mencionar la posibilidad de producir enunciados aritméticos que podemos asumir como axiomas tanto a ellos como a sus negaciones, dando lugar a teorías coherentes pero incompatibles entre sí. En última instancia se trataría de una vil repetición, aunque en un tono más dramático: o bien la razón carece de poder en este contexto, o no hay más verdad que aquella en la que de manera arbitraria nos ponemos de acuerdo. 84 Una de las metas principales del programa era recoger en un formalismo todos los vínculos entre los números, de modo que ya no fuera necesario volver al significado de los símbolos para dar cuenta de lo dado en ese dominio. Fue justo esta pretensión reduccionista lo que fracasó. 308 5. L A INTERVENCIÓN DE G ÖDEL Digamos que desde el punto de vista de la práctica matemática estas cuestiones se miran como distantes, alejadas de las preocupaciones cotidianas, o como algo que sólo sucede en determinados casos, como, por ejemplo, el de las distintas geometrías, que a fin de cuentas no son sino teorías acerca de la estructura del espacio cuya determinación corresponde a la física. Nada habría de ese mar de indecidibilidad en el horizonte de nuestro interlocutor. Pensemos ahora en lo que ocurriría si algo abrupto sucediera, digamos, en la teoría de conjuntos de Zermelo-Fraenkel con relación a alguna conjetura famosa de la teoría de los números. Escuchemos a Torkel Franzén: Sería en verdad alarmante descubrir que en ZFC no se puede determinar si hay o no una infinidad de primos de Fermat. En tal caso, muy pocos matemáticos se contentarían con saber que podemos suponer consistentemente que el número de primos de Fermat es finito o infinito, y dejarlo así. Más bien, el instinto matemático, si no otra cosa, nos dice que la cuestión de si hay o no hay una infinidad de primos de Fermat no es algo que se puede estipular significativamente de esa manera; que si esta cuestión se puede resolver en absoluto, esto requiere de un argumento que podamos percibir como matemáticamente convincente. Dado un resultado de tal naturaleza, la búsqueda de nuevos axiomas se convertiría en una tarea urgente. (Franzén, 2006, p. 442) En otras palabras, mientras la incompletud gödeliana no llegue a la matemática ordinaria, no podemos esperar por parte de la comunidad matemática una reacción similar a la ocurrida en la filosofía o en la lógica. Hasta entones, el fenómeno de la incompletud se verá si acaso como algo que afecta tan sólo a la teoría de conjuntos (hipótesis del continuo, grandes cardinales, etcétera), sin que las aguas de ese mar mojen el resto de las playas. Eso sólo sucedería, como lo señala Franzén, cuando alguna conjetura famosa de la teoría de los números se probara indecidible en ZFC. Mientras tanto, el fenómeno de la incompletud seguirá siendo una mera curiosidad teórica para los miembros de la comunidad matemática que no se interesan en los fundamentos o la filosofía de su ciencia. Comentarios finales 1. Al referirse al convencionalismo (o concepción sintáctica de la matemática) en un ensayo tentativo que jamás publicó, Gödel termina por reconocerle algún mérito a esta tendencia: [...] aunque cualquier clase de nominalismo o convencionalismo resulta ser fundamentalmente erróneo en matemáticas, no obstante la concepción sintáctica ha contribuido quizá más que cualquier otra de la concepciones filosóficas a clarificar la situación [la de la naturaleza de la matemática]: 5.4. L OS TEOREMAS DE G ÖDEL EL PROGRAMA DE H ILBERT Y... 309 de una parte, por los resultados negativos a que conducen los intentos por desarrollarla; de otra, por el énfasis que pone en una diferencia de importancia fundamental: la diferencia entre verdad empírica y verdad conceptual, sobre la que proyecta una brillante luz al identificarla con la diferencia entre verdad empírica y verdad convencional.”85 Hao Wang refuerza lo dicho por Gödel con las siguientes palabras: [...] la contribución de Hilbert no radica en haber sugerido la concepción sintáctica, sino en la formulación de problemas precisos como una manera de ponerla a prueba, aun cuando él esperaba verla confirmada y no refutada. La concepción sintáctica es un ejemplo típico de lo que comúnmente se conoce como reduccionismo. Otros ejemplos incluyen las concepciones físicas y computacionales de los fenómenos mentales.86 2. Si reflexionamos sobre el valor de las pruebas de consistencia es claro que éstas jamás ocuparán el sitio de privilegio que Hilbert les tenía reservado, en el sentido de asegurar la solidez del edificio matemático. Eso es una realidad: la idea de legitimar las teorías axiomáticas con una prueba de consistencia perdió todo interés. No obstante, aún se les puede valorar por su condición matemática (belleza, ingenio, claridad, técnicas utilizadas, etc.). Más allá de la sorpresa de que la razón matemática no puede hacerse suficientemente clara a sí misma, nos preguntamos si en realidad el problema planteado por Hilbert era tal para toda la comunidad matemática, o sólo representaba un reto para un reducido grupo de matemáticos y filósofos (lo cual se relaciona con lo que decimos al final de esta sección). En esto la postura de Bourbaki nos parece mucho más cercana a la actitud que uno encuentra en la práctica: “La ausencia de contradicción, aunque no se demuestra, se constata.”87 Esto último trae a la luz un conflicto que el segundo teorema de Gödel nos plantea: ¿cómo es posible que algo que se ofrece con tal claridad al entendimiento, como lo es la consistencia de la matemática clásica (digamos, la teoría de conjuntos de Zermelo-Fraenkel), ofrezca tal grado de dificultad cuando se le contempla desde un punto de vista puramente racional? Ante el abierto reconocimiento de un hecho como el de la consistencia, el entendimiento simple y llanamente no encuentra una explicación racional, una explicación estructurada con apego al canon de la lógica a partir de las evidencias más simples.88 85 Cita tomada de (Rodríguez, 1994, p. 207). El lugar donde Gödel dice esto es en un ensayo inédito titulado “¿Es la matemática sintaxis del lenguaje?”, II, de 1952-1954, dedicado a la obra de Rudolf Carnap. Según Hao Wang, Gödel le comentó que nunca publicó ninguno de sus ensayos sobre Carnap (seis en total) en virtud de que si bien él había probado que la matemática no es sintaxis del lenguaje, no había logrado hacer claro lo que la matemática sí es. En el siguiente capítulo volveremos a este punto. 86 Wang, 1996, p. 78. 87 Bourbaki, 1969. Cita tomada de la traducción al español, p. 63. 88 Por lo que a mí respecta, cuando vi por primera vez los axiomas de Peano o los de Zermelo-Fraenkel 310 5. L A INTERVENCIÓN DE G ÖDEL 3. Unas palabras de reconocimiento. Con base en nuestros comentarios pudiera parecer que la caída del programa nos causa regocijo. Nada más alejado de la verdad. Ciertamente, el programa fracasó, pero jactarse de su infortunio es cosa vana. Fue Hilbert quien nos enseñó cómo convertir ciertos problemas epistemológicos de la matemática en problemas matemáticos, y fue él quien fertilizó la tierra donde florecieron los teoremas de Gödel, resultados difícilmente previsibles a comienzos del siglo veinte. El programa tuvo un mal fin, pero nosotros aprendimos de ello algo que ahora sabemos con la exactitud de un teorema: que la razón matemática posee límites, y cuáles son tales límites. Hasta en su caída debemos reconocer la grandeza de Hilbert, pues fue gracias a él que la matemática tomó conciencia de su fina estructura y de sus insondables abismos. Y en vez de traerlo a la memoria por aquél locus imaginarius al que nos quiso llevar, lo debemos recordar por haber iniciado la travesía; él creyó saber a dónde habríamos de llegar, pero eso ya no importa; lo importante es que con él nos hicimos a la mar (aunque éste fuera el mar de la indecidibilidad, como lo señala Franzén). Respecto a la cuestión de la resolubilidad de todo problema matemático, a ella volveremos en la sección 5.7, una vez que hayamos cumplido dos tareas: primero, explicar brevemente la labor de Church y Turing en torno al problema de la decisión; segundo, presentar la controversia mentes-máquinas (desatada por Turing en un polémico artículo publicado en 1950), en la que el debate se centra en la cuestión de si el poder del pensamiento humano es superior al de las máquinas. Fue en el más amplio contexto de este problema que el tema de la resolubilidad adquirió una nueva apariencia. 5.5. Los teoremas de Church y Turing y el problema de la decisión En lo que sigue trataremos con un resultado demostrado por Alan Turing y Alonzo Church en 1936 de manera independiente. Se trata de un teorema que afirma la imposibilidad de establecer mediante un procedimiento recursivo si una fórmula A de la aritmética de Peano de primer orden (respectivamente, del cálculo de predicados) es derivable en el sistema. La importancia de lo anterior radica en que constituye, conforme a cierto punto de vista muy extendido, una respuesta negativa al problema de la decisión planteado por Hilbert. (incluyendo el axioma de elección), reconocí en ellos de manera espontánea legítimos principios que claramente describían el “modo de ser” de los números y los conjuntos, sin que por mi mente pasara la idea de que se trataba de algo quizá incoherente. Al comentar esta situación con mis colegas, la opinión ha sido unánime: todos ellos tuvieron la misma impresión de manera espontánea. Si bien esto no prueba nada, es un indicativo de que para muchos miembros de la comunidad la teoría axiomática de conjuntos se presenta como algo consistente sin más. 5.5. L OS TEOREMAS DE C HURCH Y T URING Y... 311 En el texto sólo trataremos con el trabajo de Turing, llevados más que nada por nuestras preferencias y por el hecho de que en él Turing sentó las bases de la teoría matemática de la computación y fijó el concepto moderno de computadora digital. 5.5.1. El problema de la decisión y las máquinas de Turing El primer contacto de Turing con el problema de la decisión fue en un curso dictado por Max Newman en 1934 sobre los fundamentos de las matemáticas. A la sazón ya se especulaba, tras los teoremas de Gödel, que la respuesta al problema de la decisión debía ser negativa, tarea en la que Turing se embarcó. Los resultados obtenidos los dio a conocer en 1936 en un artículo titulado “On computable Numbers with an Application to the Entscheidungsproblem”.89 Tenía a la sazón 24 años. La importancia de dicho trabajo radica en que en él Turing no sólo respondió a la pretensión de Hilbert de solucionar el problema de la decisión mediante la construcción de un algoritmo, sino que además sentó las bases teóricas para el desarrollo moderno de las ciencias de la computación.90 En la actualidad todo el mundo reconoce la importancia que tuvo Turing en el desarrollo de la computación moderna. Al respecto, él fue el primero en ofrecer una definición exacta de las nociones de algoritmo y función computable (con la introducción del concepto matemático de máquina computadora), y el creador de la idea de máquina con programa almacenado, razón por la cual en la actualidad se le considera como uno de los padres de la informática.91 No obstante, lo que muy pocos saben es que Turing ideó estos ingeniosos mecanismos con el objeto de resolver un problema teórico: el problema de la decisión. Como hemos visto, el programa de Hilbert incluía la completa formalización de la matemática clásica, es decir, su reducción a un sistema de signos en el que los razonamientos matemáticos se substituyen con un conjunto de reglas formales relativas al manejo de éstos. Si bien este propósito se vio frustrado de alguna manera por los 89 Turing 1936. el artículo de 1936 Turing da expresión matemática a lo que ocurre cuando alguien realiza un cómputo, es decir, cuando alguien manipula expresiones simbólicas siguiendo un sistema de reglas. En él introduce ciertos mecanismos muy simples, hoy conocidos como máquinas de Turing, que en su opinión podrían llevar a cabo las mismas tareas. Curiosamente, en su trabajo doctoral, titulado “Sistems of Lógic Based on Ordinals” (Turing, 1939), realizado bajo la tutela de Alonzo Church, Turing explora, por decirlo de alguna manera, la otra cara de la moneda: ya no la mente que computa siguiendo una regla, sino las posibilidades de la mente cuando no lo hace. En parte, la cuestión consiste en ver qué tan lejos se podría llegar en la construcción axiomática de la aritmética si la mente tuviera la capacidad de reconocer la verdad de las proposiciones indecidibles (cuya existencia había demostrado Gödel en 1931), no mediante una prueba, sino mediante la intuición u otros caminos. Esta cuestión habría de reaparecer años más tarde como parte del debate mentes-máquinas con la participación, entre otros, de Kurt Gödel, John Lucas, Roger Penrose y Robin Gandy, un tema que habremos de abordar más adelante. 91 La revista Time señala este hecho de manera coloquial observando que en la época actual todo aquél que teclea una computadora, abre una hoja de cálculo o se sirve de un procesador de palabras, está trabajando con la encarnación de una máquina de Turing. 90 En 312 5. L A INTERVENCIÓN DE G ÖDEL teoremas limitativos de Gödel, en otro sentido aportó una de las ideas clave para la programación y el cómputo formal: la de procesos mecánicos que no toman en cuenta el significado de las expresiones involucradas, sino sólo su forma. Se trata de una de las principales ideas del programa. Cuando una teoría se ha formalizado, nos podemos olvidar del significado de las fórmulas y ver el sistema como un juego que se practica con marcas en el papel. El propósito del juego es “deducir” teoremas aplicando las reglas. El problema de la decisión parece muy claro: hallar un procedimiento mecánico, digamos un algoritmo, que permita decidir si una fórmula es deducible o no de los axiomas con base en las reglas del sistema. Turing se sorprendió al descubrir que ni Hilbert ni sus seguidores intentaron clarificar la noción central implicada en el problema. Cuando se habla de procedimiento mecánico, el adjetivo atribuye al sustantivo la cualidad de poder ser llevado a cabo por una máquina. Pero, ¿qué es una máquina? Aquí la pregunta no es acerca de un conjunto de piezas o elementos móviles cuyo funcionamiento permite realizar un trabajo o transformar energía. Más bien, se trata de un dispositivo de cómputo que puede llevar a cabo el procedimiento de manera automatizada. Lo que hizo Turing fue darle forma precisa, matemática, a esta noción. Ideó para ello las “máquinas” que ahora llevan su nombre. No se trata de objetos físicos, sino de dispositivos de cómputo teóricos, los cuales no están sujetos a ningún tipo de limitación física.92 Véase el apéndice S. Acorde a lo que sabemos y entendemos acerca de estas cuestiones, estos simples mecanismos son capaces de realizar cualquier cómputo que pueda llevar a cabo un ser humano (o, para el caso, cualquier computadora moderna). Al respecto, la cuestión era reducir la noción de cómputo a algo en verdad simple y el punto es que Turing lo logró. En (Wang, 1996, p. 232), Gödel se refiere a este logro de Turing con las siguientes palabras: “Antes de Turing nadie había percibido con nitidez el concepto de procedimiento mecánico. Fue él quien nos colocó en la justa perspectiva, y ahora podemos comprender dicho concepto con claridad.” Fue la incorporación de este concepto matemático preciso (el de “procedimiento mecánico”, caracterizado a través de las máquinas de Turing) lo que permitió establecer muchos resultados de indecidibilidad con toda generalidad. Con este recurso a la mano, Turing atacó el problema de la decisión: ¿Habrá un procedimiento mecánico que permita decidir si una fórmula del cálculo puro de predicados es válida? Basándonos en el teorema de completud de Gödel de 1930, podemos reformular esta pregunta de la siguiente manera: ¿habrá un procedimiento mecánico para decidir si una fórmula del cálculo puro de predicados es demostrable en el cálculo funcional K de Hilbert y Ackermann? 92 La idea que ofrece Turing de las máquinas es muy simple y se halla expuesta en muchos lugares (v. gr., en Wikipedia). Un hecho sorprendente es que todos los mecanismos de cómputo conocidos en la actualidad son, en esencia, reducibles a máquinas de este tipo. En el apéndice S, además de una breve descripción de estos dispositivos, el lector hallará una prueba de una variante del primer teorema de Gödel basada en ellos. 5.5. L OS TEOREMAS DE C HURCH Y T URING Y... 313 Dada la caracterización que hace Turing de lo que es un procedimiento mecánico, la pregunta anterior se convierte en una pregunta acerca de la existencia o no de una máquina capaz de decidir la cuestión (es decir, de una máquina que tomando como dato a la fórmula en cuestión, se detiene habiendo impreso el número 0 cuando la fórmula no es demostrable y el número 1 cuando sí los es). La respuesta que halló fue significativa: no hay una máquina que responda correctamente con un sí o un no a la pregunta anterior en todos los casos. La demostración de este hecho implicó tres cosas extraordinarias: a) la introducción de la noción de máquina universal, b) la resolución del problema de la detención y c) un argumento diagonal inspirado en la paradoja de Russell y el teorema de incompletud de Gödel. Hablar de estas cosas en este contexto es importante en la medida en que es ilustrativa de los avances a los que condujo el programa de Hilbert (quien en ello tenía razón: la vida de las matemáticas radica en sus problemas). 5.5.2. El problema de la detención y la máquina universal El problema es muy simple: dada la descripción de una máquina y un dato de entrada, decidir si la máquina se detendrá al ser ejecutada con esa entrada.93 La respuesta a esta interrogante la halló Turing mediante la introducción de lo que él llamó máquina universal. Escuchemos a Martin Davis: “Turing nos mostró cómo producir una máquina individual que, por sí misma, puede hacer cualquier cosa que pudiera ser hecha por una máquina de Turing –un modelo matemático de una computadora orientada a todos los usos.” Grosso modo, se trata de una máquina capaz de imitar el comportamiento de cualquier máquina M a través de la lectura de un código numérico para M. Esta idea, de uso común hoy en día (las computadoras digitales actuales son versiones prácticas de este concepto) fue algo novedoso en su momento. La idea misma de codificar las máquinas en los números naturales (es decir, de representar su programa de funcionamiento mediante números) fue tomada de Gödel, quien, como ya lo hemos visto, a través de un procedimiento semejante logró expresar las reglas de la aritmética formal en ella misma (logrando de este modo construir enunciados autorreferentes).94 Según esto, cada máquina M del tipo considerado tiene asignado un código i, el cual se puede usar como un índice para ella (véase el apéndice S). Esto se indica con la notación Mi (léase: M es la máquina con número de código i). Turing “construyó” entonces una máquina U que hace lo siguiente: U(i, k1 , . . . , kn ) = Mi (k1 , . . . , kn ). En otras palabras, U aplicada a un índice i y una sucesión de números k1 , . . . , kn computa 93 Obviamente, si se impone un tiempo límite a la operación de la máquina, el problema es muy fácil de resolver. Lo que Turing mostró es que el problema se complica cuando no se impone ningún límite de tiempo, es decir, cuando se intenta determinar si la máquina se detendrá o no sin observar su comportamiento. 94 Al respecto, el lector podrá consultar el apéndice S, donde abordamos éstas y otras cuestiones relacionadas. 314 5. L A INTERVENCIÓN DE G ÖDEL lo mismo que la máquina Mi para los números k1 , . . . , kn . Turing la llamó “máquina universal”. Con estos recursos a la mano Turing imaginó la existencia de una máquina T (un programa) que siempre daría la respuesta correcta al problema de la detención (v. gr., computando un 1 o un 0). A ésta se le proporcionaría el código i de cualquier máquina M y los datos de entrada x1 , . . . , xn y como resultado arrojaría una respuesta: “1” (equivalente a “Sí, la máquina M se detendrá al ser aplicada a los datos x1 , . . . , xn ”), o “0” (equivalente a “No, la máquina M nunca se detendrá al ser aplicada a los datos x1 , . . . , xn ”). En seguida imaginó lo que sucedería: con base en T crearía, mediante una simple modificación, una segunda máquina T que haría lo siguiente: si la máquina Mi sometida a la prueba se detuviera tomando como dato su propio código i, T entraría en un ciclo infinito y jamás se detendría. En notación moderna: si Mi (i) ↓, entonces T (i) ↑. De lo contrario, T se detendría (al igual que T ) para informar que M no se detendría. Este fue el punto fino del argumento: ¿Qué pasaría si a T se le proporcionara como dato su propio código k? Supongo que el lector ya habrá hallado la respuesta: si T aplicada a su propio código se detuviera, entonces T aplicada a su propio código no se detendría (por definición de T ). Por tanto, T no debería detenerse. Pero en tal caso T debería detenerse para informar que T aplicada a su propio código no se detendría. En símbolos: T (k) ↓⇔ T (k) ↑, una contradicción que prueba la inexistencia de la imaginaria máquina T . El argumento anterior guarda una estrecha similitud con la paradoja de Russell, que, en el fondo, prueba la inexistencia de un conjunto cuyos únicos elementos son aquellos conjuntos que no se pertenecen a sí mismos. Y al igual que Russell, Turing se sirve de un argumento diagonal análogo al utilizado por Cantor en su demostración de la no numerabilidad del conjunto de los números reales. 5.5.3. El problema de la decisión Turing dedujo de inmediato un corolario: si no hay un procedimiento para determinar de antemano (mediante un cálculo) si una máquina se detendrá, tampoco hay una manera de decidir la cuestión axiomáticamente ¿Por qué? Porque si se pudiera utilizar un sistema axiomático de esta manera, con base en él se podría desarrollar un algoritmo que resolviera el problema de la detención y, por consiguiente, construir una máquina T como la ya referida. Producto de lo anterior Turing llegó a la misma conclusión que Gödel en sus investigaciones en torno a los fundamentos de la teoría de los números (en el sentido de que ninguna teoría axiomática que contenga a la aritmética puede ser consistente y completa a la vez) y a algo más: el problema de la decisión no se puede resolver de la manera en que Hilbert pretende. En efecto, si el cálculo funcional K de Hilbert y Ackermann (o cualquier otro) fuera decidible, el problema de la detención sería resoluble axiomáticamente, pues en K se pueden construir fórmulas que describen el funcionamiento de las máquinas de Turing. De hecho, así lo demuestra, para cada máquina M hay una fórmula AM con la siguiente propiedad: si hubiera un método para 5.5. L OS TEOREMAS DE C HURCH Y T URING Y... 315 demostrar que AM es demostrable o no en el cálculo de predicados, entonces habría un procedimiento para determinar si la máquina M eventualmente se detendría habiendo computado un cierto símbolo s, lo cual entraría en conflicto con la indecidibilidad del problema de la detención. Todo esto lo hizo Turing en su trabajo de 1936, en el que el énfasis lo pone en ciertas cuestiones teóricas y filosóficas, antes que en las cuestiones prácticas relativas a la computabilidad. Valga la insistencia: pensar que Turing escribió su trabajo como una mera anticipación de las computadoras modernas equivale a perder de vista el punto central de su trabajo de 1936.95 Una consecuencia del teorema sobre la indecidibilidad del cálculo de predicados es el siguiente teorema, demostrado por Church en 1936: Teorema. Sea S una teoría axiomática en el lenguaje de la lógica de predicados de primer orden. Si S contiene una representación de la aritmética recursiva y es consistente, entonces S no es recursivamente decidible, es decir, no existe una función recursiva f : N → {0, 1} tal que f (a) = 1 ⇔ a es el número de Gödel de una fórmula derivable en S. En particular, el sistema AP cumple con las hipótesis del teorema anterior, de modo que es recursivamente indecidible. Para quienes aceptan la tesis de Church-Turing, según la cual toda función aritmética efectivamente calculable (todo predicado aritmético efectivamente decidible) es general recursiva(o), el teorema anterior significa algo más: que no existe ningún procedimiento efectivo para determinar si una fórmula de S es derivable en el sistema. Esta tesis goza de una amplia aceptación por distintas razones y cuenta con un vasto soporte empírico. En cuanto a la filosofía, la incomputabilidad de Turing ha permitido cuestionar la creencia de Hilbert de que todo problema matemático es resoluble. De esto nos ocuparemos más adelante. Por ahora lo único que queremos agregar es que los resultados obtenidos por Church y Turing abrieron un nuevo frente en el campo de batalla en contra de la previsibilidad laplaciana –tal como lo hiciera algunos años antes la mecánica cuántica: en el dominio de lo computable hay certezas que no se pueden alcanzar. 95 Aunque de momento el interés de Turing no estuviera centrado en cuestiones prácticas, en su obra anticipó de un solo golpe: a) los programas de interpretación, en los que un programa general decodifica a otros programas y los implementa, es decir, los imita; y b) las computadoras con programas almacenados, con lo que la distinción entre datos y programas se borra (en U(i, k), el dato i equivale a un programa, es un programa). Podemos entonces decir que, desde la perspectiva de las matemáticas puras, Turing inventó las computadoras. Su máquina universal suministra un modelo básico y preciso de cómo trabajan las computadoras actuales, sin que esto signifique que la arquitectura de éstas corresponde al diseño de las máquinas de Turing. En este sentido, construir una máquina U que estrictamente se comporte como lo hacen las máquinas de Turing (escanear una cinta infinita unidimensional, etc.) sería tanto como crear un monstruo, un dispositivo sumamente ineficiente como para tener un uso práctico. Al respecto, Turing no ofrece en su ensayo ninguna idea de cómo poner en práctica las ideas que sugiere, dejando al futuro tal posibilidad. 316 5. L A INTERVENCIÓN DE G ÖDEL 5.6. Algunas reflexiones de Gödel en torno a los teoremas limitativos 5.6.1. Precisiones en torno a la noción de algoritmo En general, la noción de algoritmo abarca todo lo que solemos designar con términos como procedimiento efectivo, procedimiento mecánico, método y expresiones similares. Esta idea es algo común en la matemática, donde desempeña un importante papel. Su utilidad radica en que cada algoritmo proporciona la solución a una familia de problemas de manera uniforme e irreflexiva. Por ejemplo, hay un algoritmo para encontrar el máximo común divisor de dos números, otro para resolver un sistema de n ecuaciones lineales con n incógnitas, otro para integrar funciones polinomiales, etc., de modo que en cada caso para resolver cualquier problema de la familia basta con aplicar uno y el mismo procedimiento. De hecho, a lo largo de la historia, muchas cosas han sucedido en torno al problema de diseñar o mejorar algoritmos.96 En general, el propósito de todo algoritmo es indicar los cómputos y el orden en que estos se deben realizar para llevar a cabo una tarea, y el destinatario puede ser un humano o una máquina. El algoritmo en sí especifica las operaciones que hay que efectuar para transformar ciertos datos de entrada en un resultado o datos de salida. Por ejemplo, los datos de entrada pueden ser los coeficientes de un sistema de ecuaciones, y el dato de salida una de sus soluciones. Figura 5.8. Todo algoritmo transforma datos de entrada en un resultado, o dato de salida Al conjunto de resultados (datos de salida) generados por un algoritmo se le llama producción. Un dato es producible por un algoritmo cuando es un elemento de su producción. Una característica de todo algoritmo es que en su ejecución no requiere de ningún pensamiento creativo, por lo que en principio es posible construir una máquina que 96 Por ejemplo, en la sección 5.4 abordamos el problema de la decisión, que en esencia consiste en hallar un algoritmo para determinar si una fórmula cualquiera de la lógica de predicados es válida, y mencionamos el hecho de que la respuesta es negativa. Al respecto, invitamos al lector a que estime el número de algoritmos que hubo de aprender para llegar al punto en que se encuentra en el conocimiento de la matemática (incluyendo cosas como los algoritmos para la suma, la división con punto decimal, etc. que aprendió en la educación primaria). 5.6. A LGUNAS REFLEXIONES DE G ÖDEL ... 317 realice las operaciones por él indicadas.97 En este sentido un programa de cómputo no es sino un algoritmo escrito en una sintaxis muy precisa con el que se le indica a la máquina lo que debe hacer. En la aritmética, la primera definición rigurosa que se tuvo de esta noción fue bajo la forma de función recursiva. Por su parte, como ya lo hemos visto, en 1936 Alan M. Turing identificó la noción de algoritmo con los procesos que pueden llevar a cabo las máquinas que llevan su nombre. Al respecto, no pasó mucho tiempo antes de que se llegara a los siguientes resultados: 1. Una función aritmética f es recursiva si y sólo si es Turing-computable.98 2a. Para todo sistema formal SF se puede construir una máquina de Turing M con la propiedad de que M produce como datos de salida todos los teoremas derivables en SF y sólo ellos (digamos, al ser alimentada sucesivamente con los números naturales 0, 1, 2, . . .) y, 2b. Dada una máquina de Turing M cuya producción es un conjunto D de datos, existe un sistema formal SF con la propiedad de que la clase formada por los teoremas derivables en SF es precisamente el conjunto D.99 En un suplemento a su trabajo de 1931, Gödel dice lo siguiente: Como consecuencia de los subsiguientes avances, y en particular debido al trabajo100 de A. M. Turing ahora es posible una definición precisa e incuestionable de la noción general de sistema formal,101 y una versión general y completa de los teoremas VI y XI [los teoremas de incompletud]. Es decir, se puede probar rigurosamente que en cada sistema formal consistente que contenga cierta cantidad de la teoría finitista de los números, existen proposiciones indecidibles y que la consistencia de cualquier sistema formal de esta especie no se puede probar en el sistema.102 Así, las nociones de sistema formal y máquina de Turing se identifican plenamente. Estas ideas se harán presentes cuando volvamos a la discusión sobre la resolubilidad de todo problema matemático. 97 Lo que sí requiere de nuestra creatividad es el diseño del algoritmo. decir, las dos caracterizaciones recién señaladas de lo que es un algoritmo determinan una misma clase de funciones aritméticas, i. e., son equivalentes entre sí. 99 En la demostración de estos resultados se recurre a la numeración de Gödel y al método de codificación de pruebas de un sistema formal. Los podemos resumir diciendo que para todo sistema formal se cuenta con una máquina de Turing cuya producción coincide con el conjunto de sus teoremas y viceversa. 100 V. Turing, 1937, p. 249. [Nota de Gödel] 101 En mi opinión, el término “sistema formal” o “formalismo” jamás se debería usar para otra cosa que para esta noción. En una conferencia en Princeton sugerí ciertas generalizaciones transfinitas de los formalismos, pero éstas son radicalmente diferentes de los sistemas formales en el propio sentido del término, cuya característica es que en ellos el razonamiento puede, en principio, reemplazarse completamente por dispositivos mecánicos. [Nota de Gödel] 102 Gödel, 1931. Cita tomada de Heijenoort, 1967, p. 616. 98 Es 318 5.6.2. 5. L A INTERVENCIÓN DE G ÖDEL El enunciado de Gödel y las ecuaciones diofánticas Otro resultado relevante para el análisis que se aproxima es el siguiente. Como hemos visto, los enunciados indecidibles cuya existencia demuestra Gödel son de corte elemental, es decir, se trata de enunciados aritméticos que sólo hacen referencia a los conceptos de adición y multiplicación de números naturales y algunas operaciones lógicas elementales. Hacia 1950 la investigación de estas cuestiones había avanzado lo suficiente como para saber algo más acerca de tales enunciados. Lo que se descubrió es que éstos se pueden expresar en la forma ∀y1 , . . . ∀ym ∃x1 , . . . , ∃xn P(x1 , . . . , xn , y1 , . . . , ym ) = 0 donde P es un polinomio con coeficientes enteros cuyas únicas variables son x1 , . . . , xn , y1 , . . . , ym ; se sabe, incluso, que el grado de P se puede hacer menor o igual que 4. Se trata de un enunciado aritmético en el que se afirma que para toda sucesión (k1 , . . . , km ) de números naturales hay una solución (x1 , . . . , xn ) para la ecuación P(x1 , . . . , xn , k1 , . . . , km ) = 0. A las ecuaciones de este tipo se les llama diofánticas, en honor a Diofanto de Alejandría (325-409), quien fue el primer matemático en ocuparse de ellas.103 (a) Gráfica de la ecuación polinomial yx2 + y − 4x = 0 (b) Gráfica de la ecuación polinomial x3 + y2 x + 6x2 − 2y2 = 0 En las figuras anteriores hemos trazado las gráficas de dos ecuaciones polinomiales permitiendo que las variables x e y tomen como valores números reales. En el caso de las ecuaciones diofánticas esto no está permitido, pues las únicas soluciones admisibles son las correspondientes a los nodos (o puntos de intersección) de la malla de fondo, cuyas coordenadas son enteras. Por ejemplo, las siguientes parejas de números son solución de la ecuación yx2 + y − 4x = 0: (0, 0), (1, 2), (2, 1.6) y (3, 1.2). No obstante, las dos últimas soluciones no se aceptan para la ecuación, pues ambos números deberían 103 Por ejemplo, x3 y − 3x2 y2 + 3y4 − 1 = 0 es una ecuación diofántica de cuarto grado, mientras que ∀y∃x(x3 y − 3x2 y2 + 3y4 − 1 = 0) es un problema diofántico, relativo a la existencia de soluciones enteras para una familia de ecuaciones diofánticas (una para cada valor de ‘y’). 5.6. A LGUNAS REFLEXIONES DE G ÖDEL ... 319 ser enteros. Desde este punto de vista, un problema diofántico para una ecuación en dos variables x e y es la pregunta sobre si para cada valor entero de ‘y’ la gráfica de la ecuación interseca alguna recta vertical de la forma x = k donde k es un número entero. En otras palabras, cada problema diofántico sólo atañe a las soluciones enteras de una ecuación polinomial. Una vez en posesión de estos conceptos y resultados, el lector no tendrá problemas para leer los siguientes apartados, donde retomamos la cuestión de la resolubilidad de todo problema matemático y examinamos la lectura que Gödel hace de sus teoremas limitativos. La exposición de esto último se centra en la llamada Conferencia Gibbs, un ensayo en el que Gödel expone ciertas cuestiones filosóficas que él considera son una consecuencia directa de sus teoremas limitativos, siendo la más importante la de la incompletabilidad de la matemática. 5.6.3. Reflexiones de Gödel Hasta ahora nuestra atención se ha centrado en el impacto de los teoremas de Gödel en el programa de Hilbert. Veamos ahora a qué otro tipo de conclusiones llega Gödel en sus reflexiones filosóficas. Como sabemos, Gödel abriga un mundo de ideas y creencias filosóficas muy peculiares. Por ejemplo, sostiene que estamos dotados de una intuición matemática que se extiende más allá de nuestra intuición sensible, que dicha intuición es tan falible como esta última, que en la matemática es necesario acudir a la observación y a la experiencia, que la mente humana sobrepasa a todas las computadoras y que la matemática no es una libre creación del intelecto humano. En buena medida, estas conclusiones las apoya en sus teoremas limitativos. En esta ocasión nos centraremos, como ya lo hemos dicho, en las reflexiones que hiciera en torno a sus teoremas limitativos, animado por el propósito de defender el realismo conceptual o platónico. Se trata de una conferencia que Gödel pronunció ante la American Mathematical Society el 26 de diciembre de 1951 en la Universidad de Brown, en Providence, Rode Island.104 Al respecto, el texto de la conferencia sólo se conoció tras de su muerte y fue hallado en su Nachlass, bajo el título “Some basic theorems on the foundations of mathematics and their implications.” Se trata de una profunda reflexión en la que los aspectos técnicos y filosóficos se entremezclan de manera magistral. En sus reflexiones, Gödel parte del siguiente supuesto, que considera innegable: en la matemática hay un cuerpo de verdades absolutas, cuya validez no depende de ninguna hipótesis. Como sustento de esta afirmación cita dos casos: 104 V. [Gödel, 1951]. 320 5. L A INTERVENCIÓN DE G ÖDEL 1. El de los enunciados de la geometría vistos como enunciados condicionales. Ciertamente, los teoremas geométricos sólo son verdaderos con relación a los axiomas, no en un sentido absoluto. Por ejemplo, la afirmación “la suma de los ángulos internos de un triángulo es igual a dos rectos” no es absoluta, sino que depende de los axiomas que se adopten. No obstante, la que sí es absoluta es la siguiente afirmación: Si suponemos los postulados de Euclides, entonces la suma de los ángulos internos de un triángulo es igual a dos rectos. 2. Todos los teoremas de la matemática finitista son ciertos en un sentido absoluto. En cuanto a la tarea de axiomatizar la matemática propiamente dicha –es decir, el cuerpo de los enunciados que son verdaderos en un sentido absoluto–, Gödel difiere del proyecto axiomático de Hilbert sólo en el hecho de que los axiomas no pueden ser arbitrarios, sino enunciados matemáticos correctos y evidentes para nuestra intuición matemática: un retorno a la posición de Aristóteles, aunque desde una perspectiva totalmente diferente y con más de dos mil años de historia de por medio. En lo que sigue, por “matemática propiamente dicha” entenderemos este cuerpo de enunciados verdaderos de manera absoluta, a pesar de las diferentes posturas que hay en cuanto a su constitución.105 Al respecto, Gödel sostiene que el carácter inexhaustible de la matemática es independiente del punto de vista que se adopte. En su forma general, Gödel enuncia el primer teorema de incompletud como sigue: Si escogemos cualquier sistema bien definido de axiomas y reglas de inferencia en el que sólo sean derivables fórmulas verdaderas, siempre existen problemas diofánticos de carácter elemental que son indecidibles respecto de los axiomas.106 Por “bien definido” se entiende que el conjunto de axiomas es recursivo, que es posible escribir todos sus elementos en un formalismo preciso y que sus reglas de inferencia son tales que dadas cualesquiera premisas, o bien se pueden enumerar todas las conclusiones asequibles con cada una de las reglas, o bien se puede determinar que no hay ninguna conclusión inmediata asequible por medio de ellas. Dada la equivalencia entre recursividad y Turing-decidibilidad, que el sistema de axiomas y reglas de inferencia esté bien definido equivale a la existencia de una máquina de Turing capaz de enumerar una tras otra todas las consecuencias de los axiomas. Por esta razón el teorema de incompletud corresponde al hecho de que no existe un procedimiento 105 Si bien Heyting y Hilbert aceptarían en principio esta posición, en lo que no estarían de acuerdo es en lo que se entiende por “matemática propiamente dicha”. Por ejemplo, Heyting rechaza el principio del tercero excluido y algunos axiomas, mientras que Hilbert no acepta en la matemática finitista la cuantificación irrestricta, como lo hemos visto. 106 Aquí conviene recordar las cuatro maneras en que Hao Wang enuncia el primer teorema de Gödel en su libro A logical Journey, las cuales hemos citado en el comentario 5 de la sección 5.3. 5.6. A LGUNAS REFLEXIONES DE G ÖDEL ... 321 finito para decidir de manera sistemática todos los problemas aritméticos del tipo especificado: si lo hubiera, tal procedimiento se podría incorporar a un sistema formal en el que todos estos problemas serían decidibles, lo cual, como sabemos, no es posible. En particular, un problema diofántico indecidible para el sistema es el enunciado C que afirma su consistencia. Es este teorema el que hace particularmente evidente la incompletabilidad de la matemática, pues hace imposible que alguien pueda establecer cierto sistema bien definido de axiomas y reglas y, al mismo tiempo, pueda, de forma consistente, hacer la siguiente afirmación sobre él: percibo (con certeza matemática) que todos estos axiomas y reglas son correctos y además creo que contienen toda la matemática. Si alguien afirma lo anterior se contradice a sí mismo, pues si percibe como correctos los axiomas en consideración, también percibirá (con la misma certeza) que son consistentes, con lo que debe poseer una intuición matemática no derivable de sus axiomas.107 En otras palabras: quien eso diga percibirá, en contra de lo que afirma, que esos axiomas y reglas no contienen a toda la matemática, tras lo cual Gödel se pregunta “¿Significa esto que ningún sistema bien definido de axio

Hilbert y Gödel: Perspectivas Matemáticas

Products

Support

Hilbert y Gödel: Perspectivas Matemáticas

Add this document to collection(s)

Add this document to saved

Suggest us how to improve StudyLib