El Principio de la Relatividad


Save this PDF as:
 WORD  PNG  TXT  JPG

Tamaño: px
Comenzar la demostración a partir de la página:

Download "El Principio de la Relatividad"

Transcripción

1 El Principio de la Relatividad y el problema del conocimiento r Dr. Roberto Suárez Antola Julio de 2011

2 Contenido Prólogo 8 1. Introducción Mediciones de longitudes y tiempos Geometrías Ciencia y principio de causalidad Principios de relatividad y teorías de la relatividad Ciencia, filosofía y matemática La mecánica ne)oniana de partículas y su principio de relatividad Marcos de referencia inerciales: reglas y relojes ne)onianos Las leyes de la mecánica El principio de relatividad de la mecánica clásica Atracción gravitatoria Mecánica de medios continuos y óptica ondulatoria Mecánica clásica, causalidad eíciente, deterninismo y Ubre albedrío Campos y principio de contigüidad Campos en mecánica ne)oniana de partículas Campos en mecánica de medios continuos y electrodinámica: la versión fuerte del principio de contigüidad Campos en la teoría de los procesos de transporte de calor y masa: la versión débil del principio de contigüidad El postulado de posibilidad de descripción continua de los fenómenos f sicos Reconsideración del principio de causalidad La electrodinámica clásica Electro-estática, magneto-estática y electrodinámica pre-relativista La electrodinámica de los cuerpos en movimiento La teoría clásica del electrón 53 2

3 5. Las ciencias físicas al final del agio XIX La mecánica newoniana como súper-teoría física El problema del éter La ecuación de ondas clásica: la tridimensionalidad del espacio físico y la evolución de seres inteligentes Los concepos de tiempo y espacio en la teoría restringida de la relatividad El principio de relatividad de Einstein, las transformaciones de Lorentz y sus consecuencias cinemáticas Homogeneidad del tiempo, homogeneidad e isotopía del espacio y principio de relatividad de Einstein Formulación de la teoría de la relatividad independiente del postulado de constancia de la velocidad de la luz: la constante de estructura del tiempo-espacio La interrelación entre el tiempo y el espacio: el continuo de tetra-dimensional de Minkowski y la causalidad en la teoría restringida de la relatividad El grupo de transformaciones de Lorentz y la geometría de Minkowski La relatividad del espacio físico y sus consecuencias. Líneas y tubos de universo El tiempo en la teoría restringida de la relatividad Causalidad y deterninismo en el marco de la teoría de relatividad Física relativista Dinámica relativista y leyes de conservación Dinámica de una partícula Sistemas de partículas y leyes de conservación Transformación de la fuerza al cambar de marco inercial. Acción y reacción Electrodinámica, relatividad y cuantos Partículas y corpúsculos: fotones, campos gravitatorios y relojes Invariancia de la fase de una onda Efecto Doppler y aberración relativista de la luz La apariencia visual de objetos que se mueven con velocidades cercanas a la de la luz en el vacío 103 3

4 8.5 Cuadrivectores, dinámica relativista y campo electromagnético La fórmula para el tiempo propio de los re^es acelerados Algunos resultados relacionados con la mecánica de fluidos y la termodinámica relativistas Las relaciones epistemológicas entre las teorías de la f sica clásica luego de ser aceptada la teoría restringida de la relatividad Espacios curvos Teoría de superficies y geometrías intrínsecas Curvas, superficies y curvaturas en E Resumen de algunos resultados sobre geometrías intrínsecas de superficies en E Curvatura o fuerza? Movimiento Ubre de una partícula ne)oniana en una superficie Espacios abstractos y variedades de Riemann Resumen del aparato analítico de la geometría diferencial clásica Espacios euclidianos de n dimensiones Variedades riemannianas de n dimensiones Variedades lineales tangentes Inmersión de variedades riemannianas en espacios euclidianos Variedades 3-D con simetría esférica. Representación conforme en E Tensores y curvatura Tensores Coeficientes de conebón, desplazamiento paralelo y derivadas covariantes Curvas geodésicas Curvatura de una variedad de n dimensiones La gravitación y la teoría generalizada de la relatividad El principio de equivalencia El tiempo-espacio-materia y la gravitación 170 4

5 Covariancia Consistencia y tanteos preliminares Las ecuaciones del campo gravitatorio La ley del movimiento en un campo gravitatorio La relatividad restringida y la gravitación newoniana como casos límite. Deducción de la conexión entre K y G Las relaciones epistemológicas entre las teorías de la física clásica luego de ser aceptada la teoría generalizada de la relatividad El significado de la teoría matemática de la relatividad Solución de Schwarzschild y confirmaciones de la teoría de la gravitación El cálculo del tensor métrico mediante el modelo de Lenz. Métrica de Schwarzschild. Singularidades de coordenadas y singularidades gravitacionales Gravitación y curvatura del continuo tiempo-espacio Corrimiento al rojo en un campo gravitatorio Movimiento de corpúsculos en un tiempo-espacio con la métrica de Schwarzschild: avance del perihelio de una órbita y deflexión de la dirección de propagación de la luz Elementos de cálculo de variaciones Geodésica temporaloide Geodésica nula Confirmaciones de la teoría de la gravitación de Einstein Óptica gravitacional: lentes, espejismos y materia oscura El problema cosmológico Aspectos históricos El corrimiento del espectro de las galaxias y el horizonte de eventos Modelos de Universo El principio cosmológico Las ecuaciones de la relatividad generalizada y la constante cosmológica El flujo de Hubble y el postulado de Weyl 223 5

6 12.4 Modelos basados en la métrica de Friedmann-Lemaiire-Robertson-Walker Estudio estático de las geometrías a partir del término espacial del intervalo. Distancias propias y parámetro de Hubble Estudio a partir de la métrica completa. El modelo estándar H-CDM Corrimiento al rojo cosmológico El modelo cosmológico H-CDM y la teoría del Big Bang Modelo de Universo en mosaico Lametagalaxia Modelos de Metagalaxa Estrellas Enanas blancas Estrellas de neurones Agujeros negros Aspectos vinculados con la lógica de la investigación científica La estructura de las teorías f sico-matemáticas El principio de relatividad y la teoría de la relatividad Relatividad restringida Relatividad generalizada: la teoría de la gravitación Cosmología relativista Dos métodos para responder al problema de la unicidad del Universo Tiempo cósmico, espacio cósmico, marcos inerciales y modelos cosmológicos Perspectivas psicológicas y sociales Einstein y el mundo de Parménides Eljuego de ajedrez de la ciencia El reconocimiento individual a la labor científica Especialización, genialidad y desmesura La sociedad post-moderna y la relatividad 301 6

7 16. Epílogo: El principio de la relatividad y el problema del conocimiento Instrumentalismo, realismo y relatividad del movimiento de los astros Relatividad de las categorías del conocimiento Ciencia, filosofa y concepciones del mundo Bibliografa Temas de matemática Temas de f sica Temas generales relacionados con relatividad y cosmología Temas de relatividad restringida y generalizada Temas de astronomía, astrof sica, relatividad general y cosmología f sica Temas de filosofa, historia y metodología de la ciencia 315 7

8 Prólogo Este libro tuvo su origen en tres conferencias sobre teoría de la relatividad y cosmología que desarrollé, desde un puno de vista físico-matemático y epistemológico, en la Universidad Católica del Uruguay a partir de Se puede considerar como una introducción a algunos temas en la zona fronteriza entre filosofía y ciencia. Está destinado a un público interesado en los problemas que se plantean en torno al conocimiento científico en la denominada época post-moderna. No se presupone familiaridad con la epistemología ni con oras ramas de la filosofía. Los contenidos filosóficos, en particular epistemológicos, se introducen a medida que se necesitan, comenzando con el primer capítulo que está destinado por completo a ellos y culminando con el capíulo catorce, donde se examinan la estructura de la teoría restringida, la teoría generalizada y la cosmología física desde ese puno de vista. Los capíulos dos, tres y cuatro describen el desarrollo de las ideas en la mecánica newoniana de partículas y la teoría clásica de campos, incluyendo el electromagnetismo, empleando el principio de relatividad de Galileo como hilo conductor. En el capíulo cinco se examina la crisis en los fundamentos de la física del siglo XIX que condujo a la teoría restringida de la relatividad. Los capíulos seis, siete y ocho se destinan a estudiar los fundamentos, las limitaciones y algunas aplicaciones de la teoría restringida. Al final del capíulo ocho se examinan las relaciones epistemológicas entre las teorías de la física clásica luego de ser aceptada la teoría restringida de la relatividad. El capíulo 9 se destina a complementar los conocimientos de matemática. Se presupone un lector con conocimientos de álgebra, cálculo infinitesimal de una y varias variables (incluyendo elementos de cálculo vectorial) y física general como los que pueden adquirirse durante los primeros dos años de estudios universitarios de ciencia o ingeniería. Teniendo esto último en cuenta, se presentan algunos temas complementarios de matemática y de física con los que el lector pudiera no estar familiarizado. En particular, en el capíulo 9 se exponen elementos de geometría diferencial de superficies y su extensión a variedades en n dimensiones, incluyendo nociones de cálculo tensorial, transporte paralelo, geodésicas y curvatura de variedades. En el capíulo 11 se resumen los fundamentos del cálculo de variaciones cuyos resultados se emplean varias veces a lo largo de la exposición. El capíulo diez se destina a exponer los fundamentos de la teoría generalizada de la relatividad. Las relaciones epistemológicas entre las teorías de la física clásica luego de ser aceptada la teoría generalizada de la relatividad se consideran al final del capíulo. El capíulo once presenta algunas aplicaciones de la solución de Schwartzschild de las ecuaciones del campo gravitatorio y resume la evidencia confirmatoria disponible en relación con la teoría generalizada. En los capíulos doce y trece se desarrollan a continuación, con cierto detalle, aplicaciones astronómicas y temas de cosmología física relativista, acompañados de consideraciones históricas y epistemológicas. 8

9 En el capítulo quince se consideran brevemente algunos aspectos del trabaao de investigación científica desde los puntos de vista psicológico y sociológico. Se enfatizan los temas que permiten comprender los avatares en el desarrollo de las ideas científicas, hasta que desaparecen def nitivamente en el olvido o pasan a formar parte de un paradigma estabilizado y dominante. En el capítulo dieciséis el principio de relatividad y algunas de sus consecuencias se discute desde una perspectiva filosófica más amplia, enfatizando las limitaciones autoimpuestas de la cienca. Las referencias bibliográficas y algunos complementos importantes aparecen en forma de notas a pie de página. Al f nal se sugiere una lista de libros que pueden ser de interés para reafirmar algunos concepos o profundizar en los temas de ciencias f sico-matemáticas, cosmología y filosofa aquí presentados. Agradezco muy especialmente a los Profesores Mario Guerra y Carlos Zamalvide, quienes tomaron a su cargo una primera lectura crítica del texto. Sus sugerencias al respecto resultaron muy valiosas. Asimismo, agradezco el estímulo a mi trabaao brindado por el Director del Departamento de Formación Humanística, Padre Antonio Ocaña S.J. Finalmente, este libro no hubiera existido de no ser por el decisivo apoyo de mi esposa. Roberto Suárez Ántola Montevideo, 31 de julio de

10 1. Introducción "Las dos suposiciones fundamentales de la filosofía natural son: 1. Hay un mundo real externo que existe en forma independiente de nuestro acto de conocimiento. 2. El mundo real externo no es directamente cognoscible. " Max Planck, "Where is Science going", W. W. Norton & Co., New York, 1932, p. 82. "Creo que la epistemología es importante no solo para las ciencias individuales sino también para la filosofía, y que el malestar religioso y filosófico de nuestro tiempo, que a todos nos atañe, es sin duda en buena parte un malestar sobre la filosofía del conocimiento humano. Nietzche lo denominó nihilismo europeo, y Brenda la traición de los intelectuales. Yo desearía caracterizarlo como una consecuencia del descubrimiento socrático de que no sabemos nada; es decir, de que nunca podemos justificar racionalmente nuestras teorías. Pero este importante descubrimiento, que ha generado, entre muchos otros malestares, el malestar del existencialismo, solo es un descubrimiento a medias; y el nihilismo puede superarse. Pues aunque no podamos justificar racionalmente nuestras teorías y ni siquiera podamos probar que son probables, podemos criticarlas en forma racional. Y podemos distinguir entre teorías mejores y peores. Pero esto ya lo sabía, antes incluso que Sócrates, Jenófones, que dejó dicho: Los dioses no desvelaron todo a los mortales desde el principio; pero en el curso del tiempo podemos aprender y conocer mejor las cosas. " Karl Popper, en el prefacio de "En busca de un mundo mejor", Paidós, Barcelona, 2 a edición, Durante nuestra primera infancia elaboramos el concepto de realidad objetiva: la existencia de un mundo externo, independiente del observador. Los trabajos pioneros de Jean Piaget en psicología, el desarrollo de la neurociencia cognitiva, y la perspectiva evolutiva (darwiniana) de etólogos como Karl Lorenz condujeron en la segunda mitad del siglo XX a un replanteo y a una superación del tratamiento filosófico previo de las categorías del conocimiento: obeto, espacio, tiempo, causalidad, número (cardinal y ordinal), cantidad (física). Para ese entonces el desarrollo histórico de las ciencias de la naturaleza había contribuido a consolidar y a codificar el concepto de realidad obetiva en leyes, a menudo cuantitativas, como lo son desde hace siglos las leyes físicas. Si bien las leyes físicas se suelen expresar mediante relaciones numéricas, una relación numérica en sí misma no expresa una ley. Para que la relación sea la expresión de una ley, los símbolos que toman valores numéricos deben presuponer la medición de propiedades de una cosa en un contexto, real o potencialmente experimentado por un observador. Los contenidos de las ciencias son obetivos en la medida en que son reproducibles por cada observador y resultan iguales para diferentes observadores. La objetividad de la ciencia, en este sentido, implica disponer de expresiones simbólicas para expresar y comparar los resultados de actos particulares intersubetivos. Cuando, como en la física macroscópica, se abstraen unos pocos elementos de la situación observacional o del contexto experimental, y los efectos de la interacción entre el observador y el obeto observado parecen no afectar a las propiedades de éste último, efectuar una distinción tajante entre sueto y obeto, entre observador y observado, 10

11 resulta plausible e inclusive conveniente. Esto es lo que ocurre tanto en la mecánica newtoniana como en la mecánica relativista. Por el contrario, a partir de la aparición de la mecánica cuántica, la mencionada distinción, tal como se ha desarrollado en la física clásica, es cuestionada. No obstante, la validez de una distinción neta entre sujeto y objeto había sido cuestionada (mucho antes) en las ciencias humanas. 1.1 Mediciones de longitudes y tiempos En disciplinas como la Física, la Química, la Astronomía y la Fisiología es preciso trabajar con propiedades que cuando se miden originan cantidades continuas. La posibilidad de medir cantidades continuas, como longitudes, ángulos, tiempos, y masas, requiere que sea factible: (a) Definir una cantidad conservada mediante operaciones con la materia: la masa de un trozo de arcilla plástica que puede adoptar diferentes formas, un volumen de agua que se puede verter en recipientes de diferentes formas, o la longitud de una regla que se puede ubicar en distintos sitios y con distintas orientaciones. (b)combinar objetos separados de tal forma que una cantidad conservada asignable a la composición sea la suma de las cantidades correspondientes a las partes tomadas por separado. (c)introducir una unidad de medida, sus múltiplos y submúltiplos, para poder traducir cantidades en números 1. La elección de cuerpos para la medición de longitudes depende de la percepción de las relaciones entre los cuerpos materiales y sus modificaciones. La percepción visual del entorno sugiere que algunos cuerpos se deforman o fluyen en forma muy evidente, mientras que otros parecen permanecer incambiados durante meses o años. Entre estos últimos los hay alargados, como las varas de madera, que pueden emplearse a modo de unidad para comprobar la constancia de las dimensiones de los cuerpos aparentemente estables. La elección de tal o cual regla para medir longitudes es en buena medida arbitraria. Se justifica en última instancia por la simplicidad y constancia de las relaciones métricas entre los cuerpos que se descubran mediante su empleo, así como por la facilidad con que la conexión entre esas relaciones métricas y otras cantidades físicas permitan inferir regularidades en el comportamiento de los cuerpos. Algo similar ocurre con las medidas de tiempo. En principio cualquier proceso periódico puede emplearse como reloj: por ejemplo el latido de un corazón. Pero algunos procesos periódicos, como la alternancia entre el da y la noche asociada a la rotación de la Tierra, cuando se emplean como relojes permiten descubrir relaciones cronológicas simples, constantes y significativas en un conjunto muy extenso de procesos naturales terrestres y celestes: la elección de un reloj se justifica, como la elección de una regla para medir longitudes, por su utilidad tanto teórica como práctica. 1 Se supone que estos números son números reales cualesquiera. 11

12 A medida que se perfecciona el conocimiento del mundo físico, la elección de las unidades de medida y los procedimientos de medición también se perfeccionan. A su vez, el empleo de las nuevas unidades y procedimientos de medición permiten poner en evidencia regularidades más sutiles que hasta ese momento habían pasado desapercibidas y plantea nuevos problemas a la física teórica. 1.2 Geometrías Los cuerpos materiales, macroscópicos, pueden en principio verse y tocarse: se conciben como obetos que conservan su identidad bajo diferentes perspectivas sensoriales, incluso cuando no son percibidos por nuestros sentidos. El estudio cuantitativo de los cuerpos materiales con ayuda de medidas de longitudes y de ángulos, conduce al concepto de cuerpo rígido (cuerpo en el cual las distancias entre todos sus puntos, tomados dos a dos, permanecen invariables). El estudio de las relaciones entre los cuerpos origina el concepto de espacio físico. La posibilidad de dividir un cuerpo extenso una y otra vez sugirió la introducción de una idealización: el punto material o partícula. Desde este punto de vista el espacio físico se puede considerar como un sistema de relaciones entre cuerpos materiales compuestos por puntos. Un modelo matemático de este espacio físico es lo que conocemos como una geometría física, para distinguirla del concepto de geometría tal como se lo concibe en la matemática actual: lo que puede denominarse con mayor propiedad geometría matemática. Los puntos, las formas y las estructuras de esta última no tienen porqué tener relación con el espacio físico: a menudo son abstracciones construidas abstrayendo a partir de puras abstracciones de un nivel inferior. Así los espacios de la geometría matemática son conjuntos de puntos cualesquiera entre los que se definen ciertas relaciones mediante postulados. Son, pues, espacios abstractos cuyos puntos constitutivos pueden ser, por ejemplo, funciones. Desde el punto de vista matemático, una geometría consiste en el estudio de las propiedades de conjuntos de puntos de un espacio (figuras) que permanecen invariantes al transformar cada punto del espacio abstracto en otro, empleando para ello transformaciones de un determinado tipo (más precisamente, lo que en matemática se conoce, desde el siglo XIX, como grupo de transformaciones). El modelo matemático de espacio físico no tiene porqué coincidir con el de Euclides, pese a que este último se corresponde mejor con el concepto de espacio que se desarrolla en forma progresiva y más o menos tardía como parte de las capacidades cognoscitivas que se adquieren durante la infancia y la adolescencia. Al parecer fue seleccionado durante la filogenia por su valor evolutivo para la especie, junto con los conceptos de obeto, de fluo del tiempo independiente de un espacio ilimitado, y de causalidad asociada al establecimiento de una conexión entre sucesos contiguos en el tiempo, uno de ellos, la causa, que aparece primero y otro, el efecto, que aparece después de o a lo sumo simultáneamente con la causa. 1.3 Ciencia y principio de causalidad Este concepto de relación causal evolucionó hasta convertirse en el concepto de causalidad effciente propio de los estudios científicos y filosóficos desde la época de la Grecia clásica hasta la actualidad. 12

13 Las personas parten de un mundo de sensaciones y percepciones, sentimientos y voliciones, habla interna y cualidades secundarias (qualia) que en forma natural se asocian con un mundo externo. Pronto detectan regularidades: el resplandor del alba da paso a la salida del sol, el destello de un relámpago es seguido por el retumbar del trueno. Encuentra resistencias y dificultades: mover un cuerpo masivo exige un esfuerzo, retener un líquido entre las manos en general no resulta posible. Pero en el fondo todo lo que percibimos son de algún modo solo apariencias, eventos simultáneos o sucesivos, cercanos entre sí o lejanos, asociados al mundo exterior o parte de vivencias íntimas. Cuando se pone énfasis en los fenómenos, en las apariencias, la noción de causalidad pierde todo interés: desde el punto de vista meramente fenoménico la conexión entre el resplandor del alba y la salida del sol queda al mismo nivel que la conexión entre el relámpago y el trueno. Eso explica el rechazo de la causalidad como noción objetiva desde la crítica de David Hume en la primera mitad del siglo XVIII hasta las disquisiciones de filósofos contemporáneos como David Lewis. Las conexiones causales interpretadas como regularidades permanentes son, efectivamente, solamente conjeturas. No obstante, si admitimos que nuestras percepciones evocan cosas que se encuentran y acontecimientos que se producen en un mundo externo, existente por sí mismo y hasta cierto punto susceptible de ser conocido, el problema de la causalidad se puede plantear en otros términos, en los que el problema del ser se funde con el problema del conocer en una unidad indisoluble. La relación causal entendida como conexión objetiva entre eventos que acontecen en un mundo existente por sí mismo, con independencia de posibles observadores, adquiere pleno sentido en un marco de conocimientos cuya construcción y modificación progresivas presupone a su vez la búsqueda de relaciones y explicaciones causales. Que un relámpago es causa objetiva de un trueno es una conjetura que se confirma cuando se comprende que una descarga de electricidad produce una onda de choque en la atmósfera que se percibe como trueno, y en pequeña escala se reproduce lo esencial de la situación en un laboratorio. El trueno que se escucha asociado al vuelo de un avión supersónico, refuerza la validez de la conexión causal entre relámpago y trueno, debido a un fenómeno intermedio común a ambos casos: la onda de choque, que se produce en las alas del avión y se escucha luego de que éste ha pasado. Por el contrario, el resplandor del alba se asocia con, pero aunque aparece siempre primero no es causa objetiva de, la salida del sol. Ambos son efectos de la rotación de la Tierra respecto de su eje, y quedan explicados por esa rotación. En la medida en que se busquen explicaciones causales de los acontecimientos y no una mera descripción de los mismos, no es posible eludir los problemas filosóficos asociados con la causalidad, y en particular la discusión del principio de causalidad. A veces se formula el principio de causalidad como la afirmación "todo efecto tiene una causa". Esta formulación ha conducido a confusión al discutir el carácter lógico y epistemológico del principio. Un análisis cuidadoso muestra que ni es evidente en sí mismo, ni se lo puede demostrar como proposición analítica. Es ni más ni menos que un supuesto necesario para todo conocimiento científico de la realidad. 13

14 2 Como dice Messer : "Para que los cambios nos resulten comprensibles, necesitamos referirnos a sus causas. Suponemos que todo cambio tiene su causa. Este principio es válido en su universalidad no por fundarse en la experiencia, pues entonces deberíamos haber probado su validez en todas las experiencias posibles. Pero por otra parte no debemos temer que pueda ser desmentido por la primera experiencia que se presente. Si no pudiéramos encontrar a un cambio ninguna causa no nos contentaríamos con pensar que no la tiene, sino que creeríamos que la causa no es provisionalmente desconocida. El principio es válido independientemente de la experiencia... Pero si podemos considerar de este modo el principio de causalidad como una condición a priori de la experiencia, no por eso resulta válido a priori, exactamente en el mismo sentido en que lo son los principios de la matemática pura y de la lógica. No es lógicamente necesario, su negación no implica una contradicción. El concepto de cambio no contiene el concepto de causa, no contradecimos el contenido del primero si afirmamos que un cambio no tiene causa. Pero no podríamos obtener conocimiento científico alguno de un cambio semejante. Frente a él se nos pararía, por así decirlo, el intelecto. La afirmación de que todo lo existente haya de ser comprensible para nosotros no es una proposición lógicamente necesaria; es solo un supuesto y, por ende, el principio de causalidad solo tiene el valor epistemológico de un supuesto." Para los fines de un estudio como éste, que enfoca el problema del conocimiento desde la perspectiva suministrada por un análisis crítico de las ciencias físicas, admitiremos el planteo de conexiones causales solamente entre eventos, es decir entre cambios de estado en las cosas o en partes de una misma cosa. Un evento C que acontece en una cosa o en parte de una cosa a, causa un evento E (efecto) en otra cosa o en otra parte de la misma cosa [, cuando y solo cuando C genera una transferencia de energía de a hacia [ de la que resulta E. Las conexiones causales se reducen a cambios asociados en última instancia a fluos de energía en el mundo real 3. Más adelante precisaremos el alcance y las limitaciones de este punto de vista. Retomemos ahora el tema de esta introducción, 2 A. Messer, "Einfuhrung in die erkenntnistheorie", F. Meiner. Leipzig, 1909, p Parece conveniente señalar que los filósofos contemporáneos que continúan la tradición empirista, consideran que el problema de la causalidad se debe plantear solamente a nivel del lenguaje, en términos de enunciados conocidos como contra-fácticos. Ese planteo se puede resumir así: "A y B son acontecimientos causalmente conectados de modo que A es causa de B siempre y cuando si A no hubiera acontecido entonces B tampoco hubiera acontecido". Así planteada las cosas, la conexión regular observada entre el resplandor del alba y la salida del sol, interpretada como una regularidad permanente conjeturada, podría quedar comprendida dentro de este planteo siendo A el resplandor del alba y B la salida del sol. Pero como este planteo de la causalidad no insiste en el orden temporal de los acontecimientos, también se lo puede aplicar cuando A es la salida del sol y B es el resplandor del alba. Lo mismo puede decirse de la conexión entre el relámpago y el trueno. Pero mientras la conexión entre el resplandor del alba y la salida del sol no es una conexión causal en el sentido científico, la conexión entre el relámpago y el trueno sí lo es. Desde un punto de vista lógico, un enunciado contra-fáctico no es propiamente una proposición, puesto que no se le puede asignar un valor de verdad. Esto no constituye un problema para las personas que propugnan este abordaje basado en enfatizar las regularidades aparentes. Pero además, la forma contrafáctica del enunciado de la causalidad lo hace dependiente del enunciado "Si A acontece, entonces acontece B", que es el enunciado de una ley. Lo cual tampoco constituye un problema si la idea es permanecer a nivel de los fenómenos ignorando los noúmenos (cosas) del mundo externo. 14

15 orientada a revisar algunos conceptos básicos para el planteo del principio de relatividad. 1.4 Principios de relatividad y teorías de la relatividad Las posiciones relativas de los cuerpos a menudo cambian respecto de un marco de referencia formado por un cuerpo dotado con elementos para medir longitudes (reglas) e instantes de tiempo (relojes). Desde el punto de vista f sico la descripción de los cambios en un espacio cuyos elementos son puntos se hace mediante eventos. Un evento es algo que acontece en algún punto del espacio. Para distinguir un evento de otro se debe medir o especificar el instante de tiempo en el que se produce y las coordenadas de posición del lugar donde se produce, respecto de un mismo marco de referencia. Un modelo matemático de estos cambios, que permita describirlos utilizando medidas de posición y de tiempo, relativas a un cuerpo material que se toma como base para construir un marco de referencia, es una cinemática. La descripción del movimiento presupone tratar con objetos que, directa o indirectamente, pueden ser observados y medidos. Pero esto presupone a su vez que las cosas estudiadas interactúan con su ambiente. Para una descripción más completa del obeto, esa interacción debe producirse en diferentes instancias y bajo diferentes condiciones. La introducción del concepto de fuerza de interacción entre cuerpos materiales y de leyes del movimiento, en un modelo matemático que involucra esas fuerzas entre los cuerpos y permite predecir sus movimientos, conduce a una dinámica. Si se admite que un mismo fenómeno se debe poder describir respecto de diferentes marcos de referencia, o en forma equivalente se debe poder describir por distintos observadores, empleando las mismas leyes dinámicas, se introduce un principo de relatividad. Con su ayuda se pueden relacionar entre sí las descripciones temporales y espaciales correspondientes al mismo suceso en diferentes marcos de referencia. En Física se denomina teoría de la relatividad a toda teoría cuyo objeto es la discusión de todas las elecciones posibles de marcos de referencia respecto de los cuales se busca formular las leyes de la naturaleza de forma que al pasar de un marco a otro la expresión matemática de las leyes se mantenga invariante. Esta invariancia asegura que un hecho objetivo predicho respecto de un marco de referencia, tal como una colisión entre partículas, resulte predicho en cualquier otro marco de referencia admisible. Si la forma de las ecuaciones se modificara al pasar de un marco a otro, podría ocurrir que un suceso objetivo predicho respecto de un marco no resultara predicho respecto de otro marco. Desde este punto de vista la mecánica clásica comprende también un principio de relatividad, denominado principio de relatividad de Galileo, y una teoría de la relatividad basada en este principio. Pero el aspecto relativista de la mecánica de Newton permaneció siempre en un segundo plano. Cuando se hace referencia a una teoría de la relatividad, se asume en forma implícita que se trata de la teoría de la relatividad basada en el denominado principo de relatividad de Einstein, puesto que en esta teoría el punto de vista relativista pasa a un primer plano. 15

16 La introducción de un principio de relatividad por lo general restringe la clase admisible de marcos de referencia que pueden utilizarse para la descripción del movimiento de los cuerpos y sus interacciones. En el caso de la mecánica newtoniana y también en el caso de la teoría restringida o teoría especial de la relatividad, se trabaja con sistemas de referencia denominados inerciales. En la teoría generalizada de la relatividad esta restricción se suprime. Uno de los resultados principales de la teoría de la relatividad, tanto en su versión restringida como en su versión generalizada, es la interrelación entre espacio y tiempo. Esta interrelación se manifiesta cuando se conectan entre sí las posiciones y los instantes de un mismo evento respecto de dos marcos de referencia distintos. Se la puede representar mediante un espacio abstracto cuyos puntos representan eventos. Cada marco de referencia define un sistema de coordenadas de tiempo y espacio que permiten ubicar los eventos mediante cuaternas de números reales. La cinemática, en tanto mera descripción del movimiento, se reduce a una geometría en un espacio no euclidiano. La dinámica, en cuanto descripción del movimiento atendiendo a sus causas, se reduce a la identificación de curvas asociadas con las partículas y con sus interacciones. Aparece entonces una nueva geometría f sica, mucho más abstracta que la geometría f sica propia de la f sica newtoniana. Mientras que en esta última geometría física los objetos geométricos están constituidos por conjuntos de puntos considerados en un mismo instante de tiempo, en la geometría propia de la relatividad los objetos geométricos están constituidos por conjuntos de eventos. Entonces, como veremos posteriormente, respecto de un mismo marco de referencia los eventos de una misma figura pueden tener coordenadas temporales diferentes. 1.5 Ciencia, f losofía y matemática La teoría especial de la relatividad se emplea en el diseño de aceleradores de partículas para aplicaciones médicas, industriales y de investigación científica. Permite comprender el origen de y calcular la energía liberada por la fisión de núcleos atómicos tanto en los reactores nucleares (utilizados para generar energía eléctrica, para producir isótopos para uso médico e industrial y para la investigación) como en las armas atómicas de destrucción masiva. La teoría generalizada de la relatividad suministra a su vez la base física y matemática para la mayor parte de las cosmologías actuales, en particular para las cosmologías más conocidas y aceptadas por los científicos contemporáneos. Esto sugiere la importancia, tanto teórica como práctica de la física relativista y el interés que presenta su estudio. Pero además, existe un motivo más profundo, de índole filosófica. Todo desarrollo científico de gran envergadura trasciende la mera búsqueda de explicación y control de los acontecimientos en su área específica, para incidir sobre la visión del mundo de la época, modificándola 4. 4 La importancia de la revolución copernicana no estuvo en suministrar la posibilidad de un cálculo más exacto de los movimientos de los planetas en comparación con la teoría geocéntrica de Ptolomeo (cosa que por otra parte no hacía) sino en haber arrancado al hombre con su micro-cosmos y su mundo sublunar del centro de un universo acotado para arrcoarlos a un espacio infinito. En eso consistió en cambio más radical de la visión del mundo acaecido durante el siglo XVI, cambio que a su vez hizo posible la ciencia moderna. 16

17 Es ciencia que engendra meta-ciencia, o si se quiere "filosofía natural" en el sentido ahora algo anticuado con el cual Max Planck usa el término en la cita que da comienzo a este capítulo. En la medida en que la filosofa se puede caracterizar como un intento de la humanidad para construir concepciones del universo reflexionando sobre su conducta valorativa teórica y práctica, el término filosofa natural 5, algo más restringido, parece adecuado para aludir a la ciencia cuando se la considera como productora de meta-ciencia. En la medida en que la filosofa implica una reflexión sobre la conducta valorativa teórica, incluye a la teoría de la ciencia, tanto formal (lógica: reflexión sobre pensamiento correcto) como material (teoría del conocimiento: reflexión sobre el pensamiento verdadero, sobre la posibilidad y el origen del conocimiento, y sobre las categorías del conocimiento). La primer suposición de la filosofa natural que señala Planck, la existencia de una realidad externa al sujeto cognoscente, no parece ni demostrable ni refutable por medios puramente racionales. Debe admitirse como un postulado, que en todo caso encuentra un apoyo irracional en una vivencia inmediata de la realidad a través de las resistencias que las personas siempre encuentran frente a su querer y desear. La segunda suposición, la ausencia de conocimiento directo de esa realidad admitida, se refiere al mundo impersonal de los objetos reales y sus relaciones, que se encuentran detrás de nuestras sensaciones. Tomada como un postulado, justifica la tarea auto-impuesta por los científicos, de salir (por así decirlo) a la caza de la realidad apoyados en un método riguroso (experimentalhipotético-deductivo-experimental) y en un cuerpo de conocimientos previos que se va modificando sobre la marcha a medida que aparecen resultados de experimentos y observaciones que no pueden ser explicados, o se descubren inconsistencias que habían pasado desapercibidas entre cuerpos de teoría establecidos que por lo menos en parte se refieren a los mismos aspectos de los fenómenos estudiados. La caracterización del estado de algunos objetos mediante variables numéricas medibles y la búsqueda de relaciones cuantitativas entre variables introdujo los modelos matemáticos en las ciencias de la naturaleza, e hizo posible la aparición y el desarrollo de la fsica en su acepción moderna: tener un fundamento experimental y estar expresada de forma matemática. Por su parte la fsica estimuló la aparición de nueva matemática, más abstracta y de mayor alcance. Gracias a la nueva matemática, la fsica relativista y cuántica pudo ser formulada con precisión y sometida a confirmación experimental. Esto permitió modificar tanto nuestra comprensión como nuestra visión del mundo en un nivel sin precedentes. 5 Que por otra parte aparece en el título de la obra más importante y conocida de Newton: Principios matemáticos de la filosofía natural. 6 Desde una concepción filosófica instrumentalista, se considera que los científicos no buscan la verdad: se conforman con la construcción de modelos más o menos exitosos. Para los que adoptan esta postura pragmática carece de sentido decir que un modelo es más verdadero que otro: un modelo apenas puede ser más exitoso que otro, midiendo el éxito a través del balance explicativo, es decir la capacidad de explicar y predecir fenómenos observables. La pretensión de salir a la caza de la realidad, en el sentido de emprender la búsqueda de la verdad, carece entonces de sentido para los instrumentalistas. 17

18 El camino que condujo a la física-matemática contemporánea comenzó en Grecia con la geometría sintética de Euclides y la acústica musical de Pitágoras. La tradición oral sostiene que Pitágoras pasaba a menudo por un taller de herrería, en su isla natal de Samos. Parece que se detenía a observar cómo el herrero martillaba sus piezas metálicas. Un día se dio cuenta de que al ser percutidas, barras de longitudes diferentes producían sonidos diferentes, y que la altura del sonido guardaba relación con las dimensiones del otyeto martillado. Cuando volvió a su casa comenzó a experimentar con las cuerdas de una lira. Descubrió que dividiendo una cuerda por uno de los números naturales 1, 2, 3, 4 cuya suma es 10, y haciéndola vibrar, se producía lo que en música se conoce como armonía: una octava, una quinta y una cuarta. Desde el comienzo de la edad del hierro los herreros martillaban y los transeúntes escuchaban los mismos sonidos que escuchó Pitágoras. Para la mayor parte de ellos se trataba de un ruido, inclusive un ruido molesto. Para Pitágoras, ese día feliz, el ruido se transformó en información 7. Como dijo una vez Albert Szent-Gyorgyi: "El descubrimiento consiste en ver lo que todos han visto y pensar lo que nadie ha pensado". La geometría sintética de Euclides suministró la primera formulación de un sistema axiomático, que apelaba a la intuición y se apoyaba en proposiciones cuya verdad parecía evidente. El ejemplo más famoso es el axioma de las paralelas, cuya discusión y sustitución conduyo a las geometrías no euclidianas. La geometría euclidiana en su formulación original era una teoría matemática en sí, pero también una teoría de los cuerpos materiales y sus relaciones intemporales, es decir una geometría física. El punto, la línea y las figuras planas y espaciales se introducían en correspondencia con e idealizando a cuerpos materiales. El descubrimiento que los números racionales no bastaban para expresar todas las relaciones métricas de la geometría euclidiana, atribuido a Pitágoras 9, conduo a la ampliación del conjunto de los números racionales al conjunto de los números reales. La resolución de ecuaciones algebraicas llevó en el siglo XVI a ampliar el conjunto de números reales introduciendo los números complejos, que resultaron fundamentales para formular matemáticamente la f sica cuántica en el siglo XX. La formalización de la mecánica clásica se acompañó del desarrollo del cálculo infinitesimal y de la geometría diferencial de curvas y superficies en el espacio euclidiano, a partir del siglo XVII. También en el siglo XVII aparece la innovación más importante en geometría, desde la época de Euclides: Descartes sienta las bases de la geometría analítica. 7 Arthur Koestler "The act of creation Hutchinson & Co, New York, El matemático inglés Hardy decía, a principios del siglo XX, que al leer a Euclides le parecía estar en presencia de un miembro de otra universidad ("a fellow of another college"). 9 No se conocen escritos de Pitágoras. Fundó una comunidad religiosa y política en Crotona, Italia, a donde emigró desde su Samos nativa cuando contaba con 40 años de edad. Al parecer se le ocurrió la idea de que los números naturales son la fuente de todas las cosas. Dicen que cuando se dio cuenta de que había demostrado que la diagonal de un cuadrado no se relaciona con su lado mediante un cociente de números naturales, se deprimió tan profundamente que consideró que no valía la pena continuar con vida. Resulta curioso que en la antigüedad se hacía referencia a los pitagóricos y se solía evitar nombrar a Pitágoras mismo. 18

19 De ahí en más geometría y algoritmos algebraicos primero, y geometría y cálculo infinitesimal después, se desarrollan interrelacionados. Profundizando en la vía abierta por Descartes, Gauss demostró la posibilidad de construir una geometría intrínseca a una superficie, utilizando las curvas geodésicas, curvas de longitud mínima que conectan dos puntos de la superficie, están contenidas en ella y cumplen el rol de las rectas de la geometría euclidiana. Esto permite trabajar en forma independiente del espacio en el que se encuentre inmersa la superficie y la geometría resultante es común a todas las superficies que se pueden obtener a partir de la primera deformándola sin modificar las distancias entre puntos definidas por las longitudes de arco de geodésica que conectan cada par de puntos entre sí. La fundamentación del cálculo en el siglo XIX, motivada por la vaguedad y algunos errores que acompañaron su desarrollo durante el siglo XVIII, dio origen al análisis matemático moderno, así como a una definición y teoría rigurosa del continuo. Esto a su vez hizo posible la generalización de la geometría diferencial a una teoría de variedades diferenciables de n dimensiones, cuyos puntos venían representados por conjuntos ordenados de números reales entre los cuales se introducían un concepto de distancia no euclidiano. Riemann extendió a este caso más general el concepto de geometría intrínseca (incluyendo la generalización del concepto de curvatura intrínseca debido a Gauss). La investigación de geometrías abstractas definibles en dichas variedades y el desarrollo del análisis tensorial como la herramienta analítica más adecuada para esa investigación, preparó el terreno e hizo posible la formulación de la teoría general de la relatividad. A fines del siglo XIX, tanto la mecánica newtoniana como la electrodinámica se habían organizado como sistemas matemáticos formales acompañados de reglas de correspondencia entre algunos conceptos matemáticos y los datos de la experiencia. Ambas presentaban un grado muy elevado de confirmación experimental pero eran inconsistentes entre sí. En general, en fsica teórica, cuando dos sistemas formales se encuentran en una situación semejante, cabe esperar que las inconsistencias se deban a suposiciones no conectadas directamente con las mediciones o las operaciones f sicas en el laboratorio. Si es así, se pueden eliminar esas suposiciones no operacionales sin perder el grado de acuerdo con la experiencia ya alcanzado. Más aún, ese grado algunas veces se puede ampliar significativamente. Eso es lo que ocurrió cuando Einstein se dio cuenta de que el concepto de simultaneidad absoluta de eventos 10, propio de la mecánica newtoniana, no tenía fundamento operacional alguno porque no se había establecido un procedimiento para sincronizar relojes situados en puntos diferentes. Como consecuencia, aunque psicológicamente era (y sigue siendo) muy natural, el concepto absoluto de simultaneidad se puede eliminar de los fundamentos de la cinemática sin daño alguno para el resto del sistema. El motivo de fondo para abandonarlo es que si se mantiene, impide la integración de la mecánica con la electrodinámica en un todo coherente. 10 Es decir, si dos sucesos ocurren en el mismo instante para un observador, también son simultáneos para cualquier otro observador, independientemente de su estado de movimiento respecto del primero. 19

20 El insistir en la definición operacional de los conceptos físicos es importante, pero es un medio destinado a un fin: eliminar suposiciones infundadas de un cuerpo de teoría f sica. De ninguna manera puede considerarse como fin en sí mismo. El siguiente diálogo relatado por Philipp Franck resulta muy ilustrativo 11 : "Philipp Franck a Einstein: Cambió usted de opinión, o cree usted aún que cada concepto en el discurso científico debería tener un significado operacional? Einstein a Philipp Franck: Vea usted, yo no diría eso. Yo no diría que cada palabra debe tener un significado operacional, pero sí que se requeriría que en las consecuencias de cada palabra utilizada debe haber un significado operacional." El énfasis en las definiciones operacionales de los conceptos encuentra un fundamento filosófico en la escuela del Empirismo Lógico de la primera mitad del siglo XX, heredera de la Filosofía Positivista del siglo XIX. La filosofa positivista, de la cual Comte es uno de los exponentes más representativos, dio una nueva forma a la filosofía natural que emergió en el siglo XVIII a partir del éxito de la mecánica newtoniana y sustituyó a los remanentes de filosofa escolástica. Los filósofos positivistas, al extender el marco conceptual de la nueva mecánica más allá de su ámbito natural, desestimaron parte de los problemas filosóficos tradicionales considerándolo carentes de sentido y pretendieron hacer una filosofa que fuera científica. Cuando, a fines de siglo, el esquema mecanicista entró en crisis, y surgieron las teorías de la relatividad y de los cuantos para resolverla, resultó que algunas preguntas que parecían tener sentido en el marco del mecanicismo, ahora no lo tenían. La insistencia de los empiristas lógicos en adherirse estrictamente a la experiencia y desconfiar del sentido de las conceptualizaciones previas, fue una primera respuesta adecuada a la necesidad de cambiar de paradigma. Pero luego cristalizó en una filosofía todavía más restrictiva que la del positivismo. Como la gente siempre se plantea los mismos problemas fundamentales pese a la opinión de los filósofos, la expansión de la perspectiva propia del Empirismo Lógico, sobre todo en los países de habla inglesa, 12 dejó el camino libre a la filosofa existencialista en el resto y contribuyó al malestar filosófico y religioso actual al que alude Karl Popper en la segunda cita al comienzo de este capítulo. Puesto que las categorías que hacen posible nuestra experiencia y cognición dependen de nuestras características psicof sicas y de los sistemas simbólicos que nos suministra la cultura a la que pertenecemos, en este sentido se puede afirmar sin duda alguna que nuestro conocimiento es relativo. Pero de esto no se desprende necesariamente que todo conocimiento humano se limite a lo convencional y lo utilitario, o inclusive que en última instancia todo conocimiento humano sea fútil, como ha venido sosteniendo el relativismo epistemológico. 11 Philipp Franck hizo referencia al diálogo con Einstein en el Coloquio sobre Filosofía de la Ciencia realizado en Boston, Massachussetts, en diciembre de Con la posible e importante excepción de los países comunistas liderados por la antigua Unión Soviética, en los que una Filosofía del Estado (Diamat) basada en un desarrollo del materialismo dialéctico decimonónico evitó ciertos cuestionamientos y dio respuesta a los demás. 20

21 Sea cual fuere el significado metaf sico de la realidad, puesto que los seres humanos son actores en el mundo y no meros espectadores, parecería razonable suponer que el aparato psicof sico debe guardar un tipo de correspondencia con esa realidad. Esa correspondencia debe ser suficiente para permitir la supervivencia de la especie en circunstancias cambiantes: nuestro aparato psicof sico no puede estar completamente desacoplado de las cosas, o acoplado en forma fortuita. Debemos reconocer con Üexkull que el mundo (umwelt) es en cada especie biológica un producto del correspondiente sistema de recepción, procesamiento y respuesta: hay un mundo para la mosca, otro para el erizo de mar, y otro mundo para el homo sapiens. No obstante, en este último 13 caso hay una diferencia notable, que Bertalanffy señaló ya en 1937 : a través del desarrollo del conocimiento científico se produce una progresiva desantropomorfización que elimina las características específicas de la experiencia del homo sapiens. Ese proceso avanza a lo largo de tres direcciones 14. En una primera dirección la invención de instrumentos de medición produce la expansión de lo observable más allá de las posibilidades de los sentidos y la reflexión sobre los hallazgos experimentales obtenidos se acompaña de la fusión de disciplinas directamente vinculadas con la experiencia sensorial, dando origen a nuevas disciplinas, más abstractas, que no guardan relación directa con los sentidos. En una segunda dirección las constantes f sicas se miden cada vez con mayor precisión con métodos independientes y los resultados convergen, sugiriendo que esas constantes representan aspectos objetivos de la realidad, más allá de sesgos biológicos o culturales. En una tercera dirección, desaparece progresivamente todo lo que aparenta ser demasiado humano y lo que queda es un sistema de relaciones matemáticas 15. Las teorías fsicas, cada vez más, poseen contenidos que no se pueden visualizar sin desnaturalizarlos. Por un lado, con esto quedan definitivamente fuera de la ciencia parcelas enteras de la realidad. El mundo del artista y el místico, así como el mundo de las vivencias de la persona común, parece alejarse de forma definitiva. Pero por otro lado, como al final del camino la fsica formalizada no contendría nada específicamente humano, cabría esperar con Bertalanffy que el contenido matemático que expresa las relaciones fsicas se pueda trasladar, mediante reglas de correspondencia adecuadas, resultando comprensible para seres inteligentes de otro planeta cuya experiencia sensorial se basara, por ejemplo, en la percepción de rayos X y hubieran alcanzado un nivel de abstracción comparable. En este contexto adquiere pleno sentido el siguiente comentario que Max Delbrück realiza desde la perspectiva que brinda una epistemología evolutiva, "...la lección principal de las teorías general y especial de la relatividad es la siguiente: los seres humanos son organismos que pueden manipular sus representaciones internas del mundo mediante operaciones concretas y traspasar los límites de la percepción que les ha sido dada biológicamente. Pueden liberarse a sí mismos y construir una visión de la realidad que choca con la intuición, pero proporciona una visión más verdadera y de mayor alcance" (Mente y Materia, p. 297, Alianza Editorial, Madrid, 1986). 13 L. von Bertalanffy, "Das Gefüge des Lebens", Teubner, Leipzig, L. von Bertalanfff, "Generalsystem theory", Penguin Books, Londres, 1968, pp No solo las cualidades secundarias van desapareciendo del contenido de la ciencia, sino también las cualidades primarias de la física clásica. 21

22 2. La mecánica newtoniana de partículas y su principio de relatividad "No defino el tiempo, el espacio, el lugar y el movimiento, pues son bien conocidos de todos. Sólo debo observar que el vulgo concibe esas magnitudes como no sujetas a otras nociones, sino por la relación que guardan con objetos sensibles. Y de aquí surgen ciertos prejuicios para cuya eliminación será conveniente distinguirlos en absolutos y relativos, verdaderos y aparentes, matemáticos y comunes. El tiempo absoluto, verdadero y matemático, en sí mismo y por su propia naturaleza, fluye uniformemente sin consideración a nada externo, y también se llama duración; el tiempo relativo, aparente y común es alguna medida sensible externa (exacta o irregular) de la duración por medio del movimiento, y comúnmente se lo usa en vez del tiempo verdadero; por ejemplo una hora, un mes, un año. " Isaac Newton, Philosophiae Naturalis Principia Mathematica, Escolio a las definiciones iniciales, citado por Betrand Russell en El conocimiento humano, Parte IV, capítulo V, pp , Planeta-Agostini, Barcelona, "Para Newton, el espacio, como el tiempo, era "absoluto", es decir, consistía en una colección de puntos, cada uno desprovisto de estructura y siendo uno de los constituyentes últimos del mundo físico. Cada punto era eterno e inmutable; el cambio consistía en estar "ocupado" a veces por un trozo de materia, a veces por otro, y a veces por nada." Betrand Russell en El conocimiento humano, Parte IV, capítulo VI, p. 287, Planeta-Agostini, Barcelona, "Newton pensaba que el espacio no es solamente una más de las entidades físicas tradicionales; creía que el espacio es divino, convirtiendo así la geometría en una ciencia teológica. En consecuencia, los fundamentos axiomáticos de la geometría deberían revelar las leyes de la creación divina. En vista de esta perspectiva, uno puede hacerse una idea del ideal newtoniano de rigor matemático. En los últimos años de su vida, en la segunda edición de su principal obra, los Philosophiae Naturalis Principia Mathematica, Newton reiteró su reverencia hacia el espacio. Escribió: "Dios dura eternamente y está presente en todas partes; y al existir siempre y en todas partes, constituye la duracióny el espacio... En El están y se mueven todas las cosas. " Las teorías de Newton unificaron la mecánica terrestre y la mecánica celeste por primera vez en la historia. De hecho, el concepto de fuerza que actúan a distancia es, a primera vista, una idea pintoresca que parece sospechosamente cercana a la magia. Pero Newton pertenecía a una época creyente y pensaba que el objetivo de la ciencia es mostrar cómo Dios ha hecho el mundo. El Dios de Newton era el benevolente creador bíblico, que puso en marcha el reloj celestial al comienzo de los tiempos y presumiblemente le da un vistazo de vez en cuando, para comprobar que la acumulación de perturbaciones gravitatorias no se desmanda. " Max Delbrück, Mente y materia, capítulo 14, Alianza Editorial, Madrid, La mecánica newtoniana o mecánica clásica es un marco de conceptos y leyes adecuadas para describir el movimiento de los cuerpos materiales tales como las máquinas, los automóviles, las partículas de polvos y los coloides: es una mecánica de 22

23 las masas intermedias. Con algunas salvedades (casos que requieren aplicar la teoría de la gravitación basada en la relatividad generalizada), resulta extensible a la descripción del movimiento de los planetas del sistema solar, los cometas y el polvo cósmico. Algunas veces la mecánica newtoniana se puede aplicar a los movimientos de traslación de moléculas e incluso de átomos, pero es inaplicable al movimiento de los electrones. Como se dijo en la introducción, cuando las dimensiones de un cuerpo material se pueden ignorar considerándolo como localizado en cada instante en un punto del espacio, se tiene una partícula. En mecánica clásica se asume que un cuerpo material extenso se puede reducir a un conjunto de partículas componentes. Si durante el movimiento las distancias entre esas partículas componentes se mantienen invariantes, el cuerpo se denomina rígido 16. De lo contrario, se trata de un cuerpo deformable cuyo estudio debe efectuarse recurriendo a una extensión no trivial de la mecánica de partículas y cuerpos rígidos, la mecánica de los medios continuos. Comencemos por revisar brevemente algunos aspectos de interés para comprender la elaboración de conceptos conducente a la mecánica de Newton. Hasta el renacimiento se admitía la venerable doctrina aristotélica según la cual la velocidad de un cuerpo es proporcional a la fuerza aplicada, con su misma dirección y sentido. Cuando los cuerpos ascendían, como el humo, se suponía que actuaba una fuerza de levedad, y cuando caían al suelo, como una piedra, una fuerza de gravedad. El abandono del sistema geocéntrico por el heliocéntrico hizo posible pensar de una forma que hasta ese momento no había sido posible. Por ejemplo, si admitimos que la Tierra gira alrededor del Sol, y la fuerza responsable del movimiento tuviera que ver con su velocidad, entonces sería una fuerza tangencial a la órbita terrestre. Si la fuente de esa fuerza estuviera en los cuerpos celestes, podríamos mirar en la dirección de avance de nuestro planeta para ver qué encontramos. No encontramos nada en particular: a veces una estrella lejana, a veces otra, a veces nada que podamos detectar. 16 Los cuerpos sólidos son siempre en alguna medida deformables, y las perturbaciones mecánicas se propagan en forma de ondas elásticas. Las velocidades de propagación de las ondas elásticas aumentan a medida que aumenta el módulo de rigidez del sólido, es decir a medida que disminuye la deformación del cuerpo frente a una misma solicitación mecánica. Si suponemos que en principio no existe cota superior para estas velocidades de propagación, podemos concebir una secuencia de sólidos con módulos de rigidez crecientes tales que en el límite se obtendría, como idealización, un cuerpo rígido. De acuerdo con la teoría de la relatividad, una modificación producida en un lugar del espacio físico solamente puede afectar lo que sucede en un lugar remoto luego de un tiempo de propagación cuyo valor mínimo está acotado por el cociente entre la distancia que los separa dividida por una velocidad límite, la misma respecto de todos los marcos de referencia admisibles e igual a la velocidad de la luz en el vacío. La existencia de una cota superior a la velocidad de propagación de las perturbaciones implica que no es posible imaginar una secuencia de sólidos cuyo módulo de rigidez aumente sin límite de modo que las velocidades de las ondas elásticas tienden a infinito. Entonces, a diferencia de lo que se supone en mecánica newtoniana, en principio los cuerpos materiales no se pueden idealizar mediante el concepto de cuerpo rígido, puesto que una acción exterior que modifique la posición de uno de sus puntos no puede modificar simultáneamente la posición de los otros puntos de modo de conservar las distancias entre ellos. Así pues, si se admite una cota superior para la velocidad de propagación de las perturbaciones en los cuerpos materiales, hay dos tipos de cuerpos: los cuerpos deformables y las partículas, que por definición no poseen extensión. Un cuerpo deformable cuyas dimensiones son muy pequeñas respecto de las escalas espaciales en las que varían significativamente las fuerzas y se produce el movimiento, puede ser considerado como partícula No obstante, la idealización del comportamiento mecánico de los sólidos mediante cuerpos rígidos conserva toda la importancia, la utilidad y las limitaciones que siempre ha tenido en la práctica. 23

24 Pero si miramos en una dirección aproximadamente perpendicular a la velocidad de la Tierra en su órbita, en la dirección y sentido de su aceleración, hallamos en todo momento un mismo cuerpo dominante: el Sol. Si suponemos que de alguna manera el Sol produce una fuerza que causa el movimiento de la Tierra en su órbita, entonces podría conjeturarse que la fuerza cambia la dirección de la velocidad: produce aceleración, no velocidad. Generalizando a partir de este caso particular, en vez de una proporcionalidad aristotélica entre fuerza y velocidad, Newton conjeturó la proporcionalidad entre fuerza y aceleración, tanto para los movimientos celestes como para los terrestres. Como la aceleración se determina a partir del cambio en la velocidad y el cambio en la velocidad a partir del cambio en la posición del cuerpo, es necesario determinar la posición a medida que transcurre el tiempo. La determinación de la posición de un cuerpo se puede realizar tomando otro cuerpo como referencia. La relación entre fuerza y aceleración implicaba la ley de inercia, concebida ya por Galileo y otros antes que él: un cuerpo no sometido a fuerzas debidas a la interacción con otros cuerpos se mantendría en reposo o se movería con movimiento rectilíneo uniforme, tendría aceleración nula. Sí, pero aceleración nula respecto de qué? Porque dependiendo de qué cuerpo se elija para determinar las posiciones, la aceleración de un mismo cuerpo puede tomar un valor cualquiera. Por ejemplo, supongamos que un pasajero se desplaza en un automóvil en un tramo recto de carretera con velocidad constante respecto del suelo. En esas condiciones posee aceleración nula tanto respecto del vehículo como respecto de la tierra, pero se encuentra acelerado respecto del sol, y como el sol se encuentra acelerado respecto del centro de nuestra galaxia... Si hay una relación objetiva entre aceleración y fuerza de interacción entre los cuerpos, entonces se verifica solo si se elije adecuadamente el marco de referencia. Pero, como veremos a continuación, esta elección implica una elección de un proceso de medida del tiempo y de un proceso de medida de longitudes. 2.1 Marcos de referencia inerciales: reglas y relojes newtonianos Para una descripción cuantitativa del movimiento, en mecánica newtoniana de partículas y cuerpos rígidos se utiliza una clase de marcos de referencia denominados marcos inerciales, que permiten ubicar la posición (relativa al marco de referencia) de cada partícula en todo instante de tiempo, dando para cada instante sus tres coordenadas espaciales. En la práctica los marcos de referencia se construyen a partir de cuerpos que se consideran rígidos, utilizando reglas para medir distancias a partir de un origen solidario con el cuerpo, y relees para medir el tiempo. Para medir el tiempo en f sica se utiliza una clase de relees particular, de los cuales un relo de péndulo es el ejemplo más simple. Se denominan "relooes newtonianos", para diferenciarlos de los "no newtonianos", como un relo de agua. Este mide el intervalo de tiempo entre dos sucesos por el volumen de líquido que abandona un recipiente a través de un orificio en su parte inferior desde que ocurre el primer suceso y hasta que ocurre el segundo suceso. A medida que queda menos agua en el recipiente, sale más lentamente respecto del tiempo determinado por un relo de péndulo: el volumen correspondiente a un mismo número de oscilaciones del péndulo es cada vez menor. Empleando un relo de péndulo como base de comparación, el relo de agua atrasa cada vez más y la duración que el relo de agua asigna al intervalo de tiempo entre dos 24

25 eventos separados por el mismo número de oscilaciones del re^ de péndulo es cada vez menor. En el capítulo sobre la teoría generalizada de la relatividad volveremos sobre este asunto. En mecánica clásica el tiempo es absoluto e independiente del espacio. El instante en el que se produce un evento (por ejemplo el choque de dos partículas o la desintegración de un núcleo radioactivo) es el mismo en todos los marcos de referencia. Se representa mediante un número real. Un instante es posterior a otro cuando el número real que le corresponde a este último es mayor que el número real que corresponde al primer instante. Los re^es permiten establecer correspondencias entre instantes y números. Se supone que los re^es se pueden sincronizar, independientemente de su ubicación y de su estado de movimiento relativo a un marco de referencia, de modo tal que asignen al mismo instante de tiempo absoluto el mismo número real. Las coordenadas espaciales del evento son relativas, es decir dependen del marco de referencia utilizado en la descripción del movimiento. Por tanto la cinemática (la descripción del movimiento utilizando conceptos tales como trayectorias, velocidades y aceleraciones) de un sistema de partículas se debe efectuar en cada caso respecto de un marco de referencia dado. Si se emplea el concepto de espacio absoluto de Newton, uno de los marcos inerciales se encuentra fijo en el espacio absoluto, mientras que los demás marcos inerciales se encuentran en movimiento rectilíneo y uniforme respecto del espacio absoluto. Se asume que la geometría de Euclides, revisada desde la perspectiva del siglo XVII, constituye el modelo matemático que permite describir este espacio absoluto, considerado como un continente amorfo y auto-conservado de dimensiones infinitas. Se admitía que los cuerpos materiales se podían poner y sacar sin alterar la naturaleza 17 del continente. En palabras de Newton : "Podemos prescindir mentalmente de las cosas, pero no del espacio que ocupan". 2.2 Las leyes de la mecánica Respecto de los marcos de referencia inerciales las leyes de la mecánica adoptan la misma forma y la más simple. Para plantear estas leyes se puede comenzar con el concepto de masa. En este dominio de las masas medias, se podría definir en forma tentativa la masa de un cuerpo a través de su peso a nivel del suelo. No obstante, la masa que aparece en la formulación de las leyes de la mecánica clásica es la denominada masa inercial, mientras que la masa que aparece en relación con el peso de un cuerpo es la denominada masa gravitatoria. Los experimentos más precisos sugieren que la masa inercial y la masa gravitatoria de un cuerpo pueden considerarse proporcionales (y se pueden definir de modo que sean numéricamente iguales). Pero en principio se trata de conceptos diferentes, como lo comprendió y formuló el capitán de arqueros y senador genovés Juan Bautista Balliani, cuando en 1646 introdujo la distinción entre moles y pondus. Newton mismo definió la masa inercial como "la cantidad de materia de un cuerpo medida por el producto de su densidad y su volumen", lo cual, al igual que su definición 17 J. Singh "Teorías de la cosmología moderna", p. 143, Alianza, Madrid,

26 de fuerza como "cualquier acción sobre un cuerpo que cambia o tiende a cambiar su estado de reposo o de movimiento en línea recta", no dejan de presentar cierta circularidad desde el punto de vista lógico, como lo comprendió y explicó claramente Ernst Mach en 1883 en la primera edición de su influyente tratado de mecánica clásica. Mach eliminó esa circularidad lógica analizando los resultados de experimentos realizados con pares de cuerpos que actúan recíprocamente el uno sobre el otro, como cuando se encuentran unidos por un resorte o sometidos a atracción gravitatoria mutua. Los resultados de los experimentos sugieren que el cociente de las magnitudes de las aceleraciones opuestas que de esta interacción mutua resultan, es constante y depende solamente de algo que hay en los cuerpos y que se puede denominar inercia o masa inercial. El cociente de las aceleraciones se puede utilizar para definir el cociente de las masas, en general diferentes, m l y m 2 : = mj a 2 Eligiendo una masa como unidad, a partir de este cociente se pueden definir las masas correspondientes a distintos cuerpos materiales sin recurrir a la definición gravitacional, basada en el peso. La fuerza de interacción entre cuerpos se puede definir a su vez mediante el producto de la masa por la aceleración de cada cuerpo. Puesto que el concepto de espacio absoluto de Newton tiene mucho de hipótesis metaf sica, según se desprende de las citas que dan inicio a la presente sección, Mach propuso sustituirlo por el sistema formado por las estrellas fijas y definir los marcos inerciales como aquellos en movimiento rectilíneo uniforme respecto del marco correspondiente a las estrellas fijas, cuando se emplean relees newtonianos para medir el tiempo. Ahora bien, si dotamos de cierta velocidad inicial a un cuerpo, que se encuentra en un ambiente bien definido y con una posición inicial conocida, se desprende del marco conceptual de la mecánica clásica que su movimiento futuro está determinado: se desplaza, rota y se deforma de manera enteramente previsible. Con ambiente bien definido, con influencia sobre la trayectoria, se hace referencia a la totalidad de las fuerzas que actúan sobre el cuerpo. Si el cuerpo se mueve en el vacío sometido a la atracción gravitatoria de la Tierra, y no está sometido a otras fuerzas, su trayectoria resulta independiente de su masa. Supongamos ahora que el cuerpo posee carga eléctrica, se mueve exclusivamente debido a fuerzas electro-estáticas y la descripción de su movimiento se lleva a cabo respecto de un marco de referencia inercial. Si la carga y las dimensiones del cuerpo se mantienen constantes pero la masa aumenta, la desviación de la partícula producida por las fuerzas se hace cada vez menor hasta que en el límite de masa infinita el cuerpo se mueve en forma rectilínea y uniforme respecto de un sistema inercial. Esta es la primera ley de la mecánica clásica. En general, para una partícula (cuya posición en el instante t viene dada por un vector r(t) relativo a un marco inercial), el producto de su masa m por su aceleración dv(t) d 2 r(t),,,..., a(t) = = en cada punto del espacio se mantiene constante si el ambiente no dt dt 2 26

27 varía, o sea si la suma vectorial de las fuerzas ^ F j que actúan sobre la partícula no varía. La segunda ley de la mecánica clásica establece que la aceleración, la masa inercial y la fuerza resultante verifican: m a = ^F j i La tercera ley de la mecánica clásica establece que cuando dos cuerpos interactúan, la fuerza que uno de ellos ejerce sobre el otro cuerpo es igual y opuesta a la fuerza que este último ejerce sobre el primero. Si las fuerzas que actúan sobre la partícula se conocen en todo instante y en todo punto del espacio y si se fijan la posición en un instante tomado como inicial (un vector de posición) y la velocidad inicial para la partícula, la segunda ley de Newton permite tanto pre-decir como retro-decir la trayectoria. El análisis del movimiento de las partículas y de los sistemas de partículas se facilita considerablemente cuando se pueden aplicar principios de conservación de la cantidad de movimiento y de la energía. La cantidad de movimiento de una partícula es un vector que se define como el producto de su masa (escalar) y su velocidad (vector). Para un sistema se define como la suma vectorial de las cantidades de movimiento de las partículas que lo componen. Si un sistema se encuentra aislado, es decir, no sometido a otras fuerzas que las de interacción entre las partículas que lo componen, entonces la cantidad de movimiento del sistema permanece constante. Suponiendo un choque de dos partículas de masas mj y m 2 que en general produce otras dos partículas de masas m 3 y m 4 (como sería el caso de una reacción química), la conservación de la cantidad de movimiento se formula así, en términos de las cantidades de movimiento inmediatamente antes e inmediatamente después del choque: P\ + P 2 = mi v 1 + m 2 v 2 = m 3 v 3 + m 4 v 4 = p 3 + p 4 En mecánica clásica las masas se conservan, de modo que: m x + m 2 = m 3 + m 4 La energía cinética de una partícula se define como la mitad del producto de su masa y el cuadrado de la magnitud de su velocidad. La energía cinética de un sistema de partículas se define como la suma de las energías cinéticas de esas partículas. Cuando la fuerzas de interacción entre la partícula y su ambiente, o entre las partículas de un sistema entre sí y con su ambiente, poseen ciertas propiedades que permiten asimilarlas a los denominados campos de fuerza conservativos, se puede introducir la denominada energía potencial y formular un teorema de conservación de la energía: la energía y su conservación se consideran en la sección (2) destinada a analizar el concepto de campo. Para el caso de un choque de dos partículas la conservación de la energía se puede formular a partir de las energías cinéticas inmediatamente antes e inmediatamente después del choque. La energía Q se introduce para describir choques inelásticos: ri m, v, + m 2 v 2 = m 3 v 3 + m 4 v 4 + Q

28 2.3 El principo de relatividad de la mecánica clásica Un principo de relatividad se encuentra asociado con la mecánica clásica: el principio de relatividad que se suele denominar principio de Galileo. Este principio conecta la descripción cinemática de los sucesos respecto de un marco inercial K con la descripción cinemática de los sucesos respecto de otro marco inercial cualquiera K' de tal manera que la formulación matemática de las tres leyes de la mecánica clásica permanece invariantes al pasar de un marco al otro. En el caso más sencillo, se emplean sistemas de coordenadas cartesianas en ambos marcos de referencia, y el movimiento de K' respecto de K es una traslación a lo largo del eje de las x con velocidad V en condiciones tales que los orígenes de los sistemas de coordenadas coinciden en el instante inicial, el mismo en ambos marcos. En ese caso un evento (por ejemplo, la desintegración de un núcleo radiactivo) que en el instante t se produce en el punto de coordenadas x, y, z respecto de K, respecto de K' se produce en un instante t' y presenta coordenadas x', y', z' dadas por las denominadas transformaciones de Galileo: t' = t x' = x - V t y = y z = z La trayectoria de una partícula respecto de K viene dada por la ley horaria x(t) y(t) z(t). Entonces las velocidades, respecto de K, del movimiento de una partícula dx(t) dt dy(t) dz(t), se vinculan con las velocidades del movimiento respecto de K' a través de dt dt las ecuaciones siguientes, que expresan la ley de adición de las velocidades clásica: i dx'(t') dx(t) Tr Tr i dy'(t') dyit), dz'(t') dz(t) v = = V = v V v = = = v v = = = v x x y y z z dt' dt dt' dt dt' dt Con mayor generalidad, si r es el vector de posición de un evento respecto de K, si r' es su vector de posición respecto de K' y si V es la velocidad de K' respecto de K, entonces las transformaciones de Galileo adoptan la expresión vectorial: t' = t r' = r t V De las transformaciones de Galileo se desprende que la diferencia entre los vectores de posición de dos partículas en un mismo instante es la misma respecto de todos los marcos de referencia: Ar' = Ar Como consecuencia la distancia entre ellas es la misma. Entonces, en la mecánica newtoniana la longitud de una varilla es independiente del marco de referencia respecto del cual se la mide: es absoluta La trayectoria de una partícula respecto de K viene dada por la ley horaria r (t) mientras que respecto de K' viene dada por la ley horaria r' (t') = r '(t). A partir de las transformaciones de Galileo se desprende que las velocidades de esa misma partícula v(t) = r(t) y v'(t) = r'(t) se relacionan a través de la ley de dt dt adición de las velocidades de la mecánica clásica: V ' (t ) = v(t) V v(t ) = v' (t) + V 28

29 En la medida en que todos los marcos inerciales se consideren equivalentes, el concepto de reposo absoluto carece de sentido. Si un cuerpo se encuentra en reposo respecto de K, estará en movimiento respecto de K', y no hay razón para preferir uno de ellos. La noción de velocidad absoluta también carece de sentido: solo la velocidad relativa de un cuerpo respecto de otro posee significado f sico. No obstante, en mecánica newtoniana tiene sentido una aceleración absoluta. Como V es constante, las aceleraciones a(t) = v(t) respecto de K y a'(t) = e '(t) dt dt respecto de K' son iguales. Entonces la aceleración de una partícula es la misma respecto de cualquier marco de referencia inercial. Dicho de otra forma, es un invariante bajo las transformaciones de Galileo. En mecánica clásica la masa inercial se asume independiente del estado de movimiento del cuerpo, así que también es un invariante. Como las fuerzas de interacción a distancia entre las partículas materiales se supone son las mismas en cualquier marco de referencia, la ecuación que expresa la segunda ley m a = ^F. es invariante bajo las transformaciones de Galileo. Consideremos ahora un marco de referencia no inercial Ñ que se mueve con velocidad V(t) con respecto de un marco inercial K. En ese caso la velocidad v(t) de un cuerpo respecto de K se puede expresar como la suma de su velocidad v'(t) respecto del marco no inercial y la velocidad de este último respecto de K: v(t) = v'(t) + V(t) Si m a = F es la expresión de la segunda ley de Newton respecto de K, entonces respecto de Ñ la segunda ley adopta la forma: m a = F - m W Aquí a' = dv (t) es la aceleración del cuerpo relativa al marco no inercial Ñ y e dt WW(t) = (t ) es la aceleración de Ñ relativa a K. Respecto de un sistema no inercial el movimiento se produce bajo una fuerza adicional, proporcional a la masa del cuerpo cuyo movimiento se considera, posiblemente variable en el tiempo y en el espacio. Se la denomina fuerza de inercia. Si Ñ se traslada y rota respecto de K, la aceleración W(t) se puede descomponer en la suma de cuatro términos: una aceleración de arrastre asociada a una traslación no uniforme de Ñ respecto de K, y tres términos debidos a la rotación de Ñ respecto de K. Dos de ellos involucran la velocidad angular del marco no inercial respecto del marco inercial: una aceleración centrífuga y una aceleración de Coriolis. El tercero involucra la aceleración angular. La aparición de las fuerzas de inercia - m W establece una diferencia entre los marcos inerciales y los no inerciales que es absoluta. Al respecto dice Newton en el Escolio natural": 18 a los "Principios matemáticos de la filosofa 18 Ver Einstein y otros "La teoría de la relatividad', Altaya, Barcelona, 1993, pp

30 "Los efectos que distinguen el movimiento absoluto del relativo son las fuerzas que actúan alejándose del eje en un movimiento circular. Pues tales fuerzas no existen en un movimiento circular puramente relativo, mientras que en un movimiento circular verdadero y absoluto son mayores o menores según la cantidad de movimiento. Si de una cuerda de buena longitud suspendemos un cubo, lo hacemos girar hasta que la cuerda se halle fuertemente retorcida y lo llenamos luego de agua, manteniéndolo en reposo junto con el agua, entonces, por una acción repentina de otra fuerza, el cubo comenzará a girar en sentido contrario, y mientras la cuerda recupera su estado primitivo, el cubo persistirá durante algún tiempo en este movimiento; al principio la superficie del agua será plana, tal y como lo era antes de que el cubo comenzara a girar, más después el cubo, al ir comunicando gradualmente su movimiento al agua, obligará a ésta a iniciar un movimiento sensible de rotación y a alejarse poco a poco del centro y ascender por las paredes del recipiente, tomando la forma de una figura cóncava (como yo mismo he experimentado), y cuanto más rápido se hace el movimiento, tanto más subirá el agua, hasta que, por último, ejecutando sus revoluciones al unísono con el recipiente, quedará en reposo relativo dentro de él. Esta ascensión del agua demuestra su propensión a alejarse del eje del movimiento; y el movimiento circular verdadero y absoluto del agua, que aquí es directamente contrario al relativo, se pone de manifiesto y puede ser medido a través de dicha propensión." Siguiendo esta misma línea de razonamiento se puede explicar la forma achatada en los polos de nuestro planeta: si éste gira respecto del espacio absoluto alrededor de su eje, entonces aparecerán fuerzas centrífugas que tienden a dilatarlo tanto más cuanto más próximo se encuentre la zona considerada del ecuador y al mismo tiempo la aceleración de la gravedad será menor donde la fuerza centrífuga sea mayor, cosa que efectivamente ocurre. En "La ciencia de la mecánica" Mach 19 retoma el argumento del cubo de agua de Newton, y dice al respecto: "...si fundamentamos nuestros argumentos sobre la base de los hechos comprobamos que el único conocimiento posible es el de espacios y movimientos relativos. Relativamente, o lo que es lo mismo, haciendo caso omiso de ese ignoto e ignorable medio del espacio, los movimientos del universo son los mismos independientemente de que adoptemos la concepción ptolemaica o la copernicana. Ambas concepciones son, de hecho, igual de correctas, sólo que la última es más simple y más práctica. El universo no nos ha sido dado dos veces, una con una tierra en reposo y otra vez con una tierra en movimiento, sino una sola vez, con sus movimientos relativos, que es lo único susceptible de ser determinado..el experimento de Newton con el cubo de agua en rotación, únicamente nos dice que la rotación relativa del agua respecto a las paredes del recipiente no produce ninguna fuerza centrífuga perceptible, pero que tales fuerzas sí se producen como consecuencia de la rotación relativa respecto de la masa de la tierra y demás cuerpos celestes. Y nadie está autorizado para predecir qué ocurriría si las paredes del recipiente aumentaran de espesor y de masa hasta alcanzar un espesor de varias leguas.las consideraciones que acabamos de exponer demuestran que no es necesario referir la ley de inercia a ningún espacio absoluto especial. Todo lo contrario: las masas que, según la fraseología común, ejercen fuerzas unas sobre otras y aquellas 19 Ver Einstein y otros "La teoría de la relatividad', Altaya, Barcelona, 1993, pp

31 que no ejercen para nada dichas fuerzas, guardan una relación muy similar respecto de la aceleración. De hecho, podemos considerar que todas las masas están relacionadas entre sí." En lugar del espacio absoluto, Mach propuso utilizar como marco inercial básico el sistema que ya era empleado en astronomía, fijo al sistema estelar considerado como un todo. Los demás marcos inerciales se definen como en movimiento rectilíneo y uniforme en relación con este sistema fijo a las estrellas. Una relación general y particularmente importante entre masas, que en su momento 20 motivó el desarrollo de la teoría generalizada de la relatividad, es precisamente la que establece la atracción gravitatoria entre ellas acompañada de la igualdad entre las masas inercial y gravitatoria de un mismo cuerpo. 2.4 Atracción gravitatoria Para la atracción gravitatoria entre dos masas gravitatorias puntuales m g1 y m g 2, separadas por una distancia d 12, Newton planteó la siguiente expresión, en la cual G = 8 3 6, 67 c 10 - cm /g c s es la denominada constante de gravitación universal y el signo - indica su naturaleza siempre atractiva: F m. m 2 2 = -G g1 g2 12 í 2 Supongamos que a 1 es la aceleración que un campo gravitatorio g produce en el cuerpo de masa inercial m 1 (con masa gravitatoria m g x ) y a 2 d 12 es la aceleración producida en el cuerpo con masa inercial m 2 (con masa gravitatoria m g 2 ) por ese mismo campo. Por la segunda ley de Newton: m 1 a 1 = m g 1 g m 2 a 2 = m g 2 g Entonces, siempre y cuando a 1 = a 2 para todo par de cuerpos de prueba sometido a un campo gravitatorio de la misma magnitud, se verificará para todo par de cuerpos la proporcionalidad entre la masa inercial y la masa gravitatoria = m2 m g,2 En unidades adecuadas esa proporcionalidad se expresa como una igualdad. La exactitud con la que en cada caso se puede comprobar la igualdad de las masas inercial y gravitatoria de un mismo cuerpo está determinada por la exactitud con que se pueda comprobar que a 1 = a La evidencia experimental sugiere que la masa gravitatoria y la masa inercial de un cuerpo son proporcionales, pudiendo tomarse como iguales: m = m 20 Einstein reconoció en varias ocasiones la influencia del pensamiento de Mach sobre la consolidación de sus propios puntos de vista sobre el principio de relatividad en Física. 21 Esta igualdad fue confirmada, a menos de un pequeño error experimental de una parte en 10 8, en una famosa experiencia efectuada por Éotvos en 1890 utilizando un péndulo de torsión. Se ha retomado el tema varias veces desde entonces, con técnicas experimentales más sofisticadas y la confirmación se ha producido a menos de un error cada vez menor. Los experimentos Eot-Wash confirman la igualdad a menos de una parte en y la misión espacial STEP (Satellite Testing of the Equivalent Principle), si tiene éxito podría suministrar una confirmación a menos de una parte en

32 Si bien el concepto de fuerzas que actúan a distancia parecía extraño (Newton mismo objetaba este concepto, por razones filosóficas), la aplicación de la mecánica de partículas y la ley de gravitación newtoniana al sistema solar y al movimiento de los cuerpos terrestres tuvo éxito asombroso, al igual que su extensión para describir la deformación de los sólidos elásticos y el flujo de líquidos y gases. Además, el principio de relatividad de Galileo implica que las interacciones entre los cuerpos materiales deben propagarse instantáneamente a través del espacio vacío: la modificación en el estado de un cuerpo debe afectar de inmediato a los otros cuerpos que interactúan con el primero, no importa cuán alejados de él se encuentren dichos cuerpos. Si así no fuera, y una perturbación en un cuerpo se propagara por el vacío con velocidad finita respecto de un marco K', entonces por la ley de adición de velocidades v(t) = v'(t) + V esa perturbación se propagaría con una velocidad diferente respecto de otro marco K. Pero entonces sería posible distinguir K de K' desde el punto de vista de la mecánica, lo cual a su vez contradice el principio de relatividad de Galileo. Así pues, la acción a distancia, tal como aparece en la ley de gravitación de Newton y en la ley de acción y reacción, es una consecuencia del principo de relatividad de la mecánica clásica Mecánica de medios continuos y óptica ondulatoria El concepto de partícula de la mecánica newtoniana desciende directamente de los átomos flotando en el vacío de Leucipo y Demócrito. A su vez la idea del átomo de los filósofos griegos parece haber surgido naturalmente al reflexionar sobre el modelo de materia de Anaxímenes. A partir de observaciones de los objetos que lo rodeaban, este pensador formuló la conjetura siguiente: los estados de la materia son cuatro (sólido, líquido, gaseoso e ígneo) y cuando una porción de materia cambia de estado no altera su naturaleza sino que se expande o contrae según corresponda. Al expandirse las partes de la materia se separan entre sí. Si suponemos que la materia se distribuye sin interrupción a través de un volumen, y luego se expande, qué es lo que se separa? Una forma de responder a ésta pregunta es añadir una nueva conjetura: la materia está formada por puntos aislados o parcelas diminutas invisibles, que se alejan unas de otras cuando una porción macroscópica (visible) de materia se expande, y se aproximan entre sí cuando se contrae. Si suponemos que estas rarefacciones y condensaciones no alteran la naturaleza de estos átomos, la suposición de Anaxímenes acerca de que la naturaleza de la materia no se altera al cambiar de estado se encuentrajustificada. No obstante esta fructífera, duradera y respetable tradición de atomismo, la aplicación de la teoría corpuscular de la materia basada en las ecuaciones de Newton para describir 22 Esto no se contradice con la velocidad finita de propagación de las interacciones a través de un medio material continuo, como se observa en el caso de ondas mecánicas en sólidos u ondas acústicas en gases o líquidos, puesto que en estos casos la velocidad de propagación de las perturbaciones mecánicas se define en relación con un cuerpo material dado. 32

33 la deformación y el fujo de los materiales resultó inviable debido al gran número de corpúsculos involucrados. Esta descripción se necesitaba para hacer posible un ulterior desarrollo de disciplinas técnicas como la hidráulica y la resistencia de materiales. No se halló otro camino a seguir que promediar y efectuar aproximaciones. Se desarrollaron dos enfoques complementarios: el propio de la mecánica de los medios continuos, adaptado de inmediato al uso de los ingenieros, y el característico de la mecánica estadística, que permaneció durante varias décadas en manos de los fsicos y en consecuencia tardó un poco más en integrarse al acervo de herramientas tecnológicas. La mecánica de medios continuos supone que la materia se encuentra distribuida en los cuerpos tal como parece en una observación macroscópica: en forma continua. Se introduce un campo de desplazamientos para cada punto de un medio continuo. Se definen un estado local de deformaciones (deducido a partir del campo de desplazamientos del medio continuo) y un estado local de esfuerzos. Se adapta la formulación matemática de las leyes de la dinámica newtoniana de partículas a los medios continuos. A partir de los resultados de observaciones y experimentos cuidadosos se plantean relaciones constitutivas entre el estado de esfuerzos y el estado de deformaciones para los sólidos, y entre el estado de esfuerzos y la velocidad de cambio del estado de deformaciones para los líquidos y gases. Nacen así la teoría de la elasticidad la hidrodinámica y la aerodinámica. Al mismo tiempo se afirma el punto de vista ondulatorio acerca de la naturaleza de la luz. Fresnel, reflexionando acerca de las analogías entre la propagación de las ondas elásticas en los sólidos continuos y la propagación de la luz, conjeturó la existencia de un medio elástico que llenaría la totalidad del espacio y que sería el portador de las ondas luminosas. Las ondas luminosas se podrían reducir entonces a la propagación de deformaciones de ese medio un éter elástico según leyes mecánicas. 2.7 Mecánica clásica, causalidad eficiente, deterninismo y fibre albedrío A partir de mediados del siglo XIX se extendió por Europa y su área de influencia intelectual, la idea de la materia como algo permanente, tangible en el espacio dotado de masa, sujeto a leyes de evolución y conservación conocidas, leyes que podían ser y efectivamente eran corroboradas a partir de las observaciones y mediciones del movimiento. Se hizo cada vez más común la creencia que la materia existía desde siempre, no pudiendo ser ni creada ni destruida. En esta imagen del mundo f sico la materia se movía de acuerdo con las leyes de Newton, cada porción impulsada por las fuerzas que sobre ella ejercían las demás porciones, e impulsándolas a su vez. Para caracterizar el estado de un cuerpo en el sentido dinámico clásico del término bastaba con especificar las posiciones y velocidades de sus partes constituyentes. Muchas personas familiarizadas con las ciencias f sico-matemáticas de aquel tiempo creían que si se conocían las posiciones y las velocidades iniciales de los diferentes cuerpos, es decir, sus estados dinámicos, entonces, por lo menos en principio era 33

34 posible predecir el movimiento en sus más mínimos detalles, recurriendo a fuerzas de interacción conocidas para dar cuenta de los cambios de estado de los cuerpos y de las transferencias de energía que acompañan a esos cambios. Esto a su vez permitía una interpretación de los movimientos en términos de cadenas causa-efecto. A comienzos del siglo XIX, Laplace formula con bastante precisión este determinismo científico basado en el concepto de causa eficiente, considerado como doctrina sobre la estructura y dinámica del mundo. En el siglo XIX y en el siglo XX el empleo del concepto de causa eficiente se extiende progresivamente de las ciencias fsicas a todas las ciencias de la naturaleza, la psicología y la sociología. Esa extensión se acompaña de una reducción en el empleo de las causas finales, que terminan circunscritas apenas a algunas áreas de las ciencias humanas. En el marco del paradigma de la mecánica clásica de partículas y medios continuos, se vuelve a plantear nuevamente en el siglo XIX el problema del libre albedrío, cuyos orígenes en la tradición de occidente se remontan a la filosofía griega, cinco siglos antes de Cristo. Si la dinámica de la materia que forma el cuerpo de una persona está estrictamente determinada por leyes fsicas y químicas que rigen sus interacciones con los cuerpos externos y entre las partes del organismo, los movimientos de sus extremidades también lo estarían. Siguiendo esta línea de pensamiento, parecería que los movimientos voluntarios de una persona no serían tales. Yendo un poco más lejos en la misma dirección, el sentimiento de ser capaz de elegir que todas las personas en mayor o menor grado en general presentan, y la correspondiente responsabilidad individual, podrían ser una ilusión. 23 Este problema preocupó a los primeros atomistas, en su intento de reducir el mundo y su dinámica a átomos y vacío. Resurgió en un contexto teológico cuando San Agustín extrajo conclusiones sobre el libre albedrío razonando a partir de la omnisciencia y omnipotencia de Dios 24. Los filósofos volvieron a plantear y a discutir el problema de la compatibilidad entre la libertad y el determinismo, una y otra vez, con ropajes diferentes según la época. En el siglo XX se produce el apogeo y la posterior crisis del determinismo científico, cuestionado desde adentro de la física por el desarrollo de la mecánica cuántica en la primera mitad de ese siglo, y desde afuera de la f sica por el desarrollo de nuevos conceptos ontológicos y epistemológicos sobre sistemas y emergencia, en las ciencias y en la filosofía de la segunda mitad del siglo. No obstante el problema de la relación entre libertad y determinismo continuó ocupando un lugar en las discusiones filosóficas hasta la actualidad. 23 Se sabe que en particular preocupó a Demócrito, quien salió del brete sosteniendo que su modelo de átomos en el vacío era una conjetura destinada a explicar las percepciones de los sentidos, pero afirmaba, como un precursor de Kant, que ignoramos cómo son realmente las cosas (los noúmenos). 24 De la omnisciencia y omnipotencia parecía desprenderse que las personas no pueden hacer algo que Dios no lo sepa y no solo que no lo consienta, sino que no lo determine. 34

35 Aún en un marco de ideas decimonónicas, era posible distinguir los problemas de la libertad de los problemas del determinismo. Esta distinción elimina algunas dificultades del planteo como problema único y permite replantear toda la cuestión en relación con el libre albedrío y con el determinismo en otros términos. Al parecer el primero que planteó esta distinción fue Carlos Vaz Ferreira en el Uruguay de comienzos del siglo XX 25. Una diferencia notable entre la ciencia y la filosofa, sobre la que Vaz Ferreira insistía a menudo, se encuentra en el sentido que se le asigna a las palabras en una y otra de esas disciplinas. Cuando en los científicos decimonónicos se referían a la materia, esa palabra tenía más o menos el mismo significado para todos ellos. Partían de datos de la percepción, despooándolos de las propiedades que la psicología mostraba eran esencialmente de naturaleza subjetiva, pero pensaban sobre la materia más o menos en el mismo nivel de abstracción, utilizando el concepto en el marco de la mecánica clásica, dotándolo así de un significado implícito pero sin discutir el concepto mismo. El nivel de abstracción era el mismo por una especie de acuerdo tácito lo cual permitía poner a prueba sin excesiva ambigüedad las proposiciones que involucraban el concepto fsico de materia 26. Los filósofos, por su parte, entre otras actividades, analizan los significados de los términos del lenguaje desde sus correspondientes posturas metaf sicas y construyen sus teorías filosóficas. A diferencia de lo que suelen hacer los científicos, los filósofos no trabajan siempre en un mismo nivel de abstracción, sino que se adentran a través de niveles de abstracción sucesivos. A veces no explicitan el nivel de abstracción lo suficiente. Pero una vez comenzado el camino de abstracción progresiva, la misma palabra, por ejemplo materia, se utilizaba para aludir conceptos ubicados en niveles de abstracción diferentes, lo cual además de prestarse a una considerable confusión, puede tener como consecuencia que el valor de verdad de una afirmación en un nivel de abstracción puede modificarse en el nivel siguiente. Esto en sí mismo no es un problema si se tiene presente el nivel de abstracción en el que 25 C. Vaz Ferreira, "Estudios filosóficos. Antología", Aguilar, Buenos Aires, 1961, pp Un enfoque en cierta medida análogo al de Vaz Ferreira, fue utilizado posteriormente por Ernst Cassirer cuando discutió el problema del libre albedrío en relación con la crisis de la causalidad que acompañó la interpretación de Copenhague de la mecánica cuántica. 26 Después de la aparición y consolidación de las físicas relativista y cuántica, el concepto científico de materia propio del siglo XX tiene poco que ver con el del siglo XIX: es mucho menos rudimentario pertenece a un nivel de abstracción más profundo y tanto él como los términos relacionados (como el de masa) han sufrido procesos de diferenciación de conceptos (aparición de los conceptos de masa de reposo y de materia cuya masa de reposo es nula, como es el caso de los fotones) y de integración de conceptos (confluencia o equivalencia de masa y energía, e intercovertibilidad de materia con masa de reposo y materia sin ella, como en la aniquilación electrón-positrón para dar origen a fotones o la creación de pares electrón-positrón a partir de fotones) muy significativos. Pero sigue habiendo un cierto grado de acuerdo tácito sobre cómo debe utilizarse ese término y los términos con él relacionados, ahora con sus nuevos significados, en el marco de las actuales teorías físicas. 35

36 27 se trabaja, pero lo es si éste último no ha sido debidamente explicitado. Los problemas del determinismo son problemas referidos a la dependencia o no de fenómenos o eventos respecto de sus antecedentes: si se quiere se los puede formular en términos decimonónicos de cuerpo material, fuerza y movimiento, en un marco de mecánica clásica. Los problemas de la libertad son problemas referidos a la dependencia o independencia de los actos de un ser con respecto al mundo exterior de ese ser. Aquí, siguiendo a Vaz Ferreira, utilizamos las palabras ser y acto como se las emplea y comprende en el lenguaje común. Entonces, si un ser no es totalmente dependiente de lo que no es él, puede ser libre aunque sus actos en la medida que involucren eventos internos y externos al ser, puedan depender de todos sus antecedentes y estar así en conjunto, determinados. La analogía del barco a vapor, que pone Vaz Ferreira, ilustra lo que se quiere decir. El barco representa al ser, el mar y la atmósfera que lo rodean representan el mundo exterior al ser. Cuando la caldera no produce vapor y la hélice se encuentra detenida, las corrientes marinas y los vientos determinan el rumbo del barco: no es libre porque sus actos están determinados por su mundo exterior. Cuando la hélice se encuentra en funcionamiento su rumbo depende del impulso que suministre al barco combinado con el arrastre de las corrientes y los vientos: es parcialmente libre porque sus actos no están determinados enteramente por el mundo exterior. Pero en ambas situaciones todos los eventos que involucran al barco están determinados por sus antecedentes. Así pues, puede darse una respuesta positiva a un problema de libertad relativo a un ser aún cuando el correspondiente problema de determinismo relativo a los actos de ese ser tenga también una respuesta positiva. También puede concebirse una respuesta positiva al problema de la libertad junto con una respuesta negativa al problema del determinismo. Pero, contrariamente a lo que a menudo se piensa cuando no se distingue entre los problemas de la libertad y los problemas del determinismo, para poder admitir el libre albedrío no es necesaria la indeterminación en el mundo físico introducida por la física cuántica. Ernst Cassirer señalaba, al analizar el determinismo y el indeterminismo en la mecánica cuántica, que el libre albedrío de los seres humanos se vincula con la posibilidad de una conducta ética. Esta última está por lo general determinada por valoraciones y motivaciones que van de lo más abyecto a lo más sublime. La conducta ética parece ser en lo fundamental predecible, determinada, en vez de ser un fruto del azar. Desde el punto de vista psicológico los fenómenos relacionados con la voluntad resultan a 27 Si los términos materia y masa se utilizan en un análisis filosófico con el mismo sentido que se les asignaba en la ffsica decimonónica, entonces el enunciado "toda materia posee masa" es verdadero. Pero si se les asigna el significado que tienen en la teoría restringida de la relatividad, y si se sobrentiende que con "masa" se alude a lo que en física relativista se denomina "masa de reposo", entonces ese enunciado es falso, porque los campos electromagnéticos no poseen masa en reposo pero no obstante hay acuerdo en considerarlos parte de la materia. 36

37 menudo inescrutables desde el exterior del ser, pero aparecen en gran medida determinados cuando se los considera teniendo en cuenta al ser en el mundo. No son precisamente los huecos en el determinismo los que en los seres humanos se llenan con libre albedrío. 28 Como decía Bertrand Russell, "la libertad en cualquier sentido que se la tome digno de tenerse en cuenta, solo pide que nuestras voliciones sean, como son, fruto de nuestros propios deseos y no efecto de una fuerza exterior que nos coaccione a querer lo que no quisiéramos...el libre albedrío es real en la única forma que importa." Además del determinismo científico aplicado a los acontecimientos del mundo real, que es en principio refutable, se tiene otra modalidad el determinismo metafísico. Los que adoptan esta postura sostienen que todos los acontecimientos están predeterminados, que el futuro es tan inamovible como el pasado, con independencia de la existencia de observadores y de todo intento de predicción. Los sucesos están predeterminados inclusive aunque el mundo no manifestara regularidades y pareciera aleatorio. Esta versión débil del determinismo no parece poseer suficiente contenido empírico como para ser contrastada y eventualmente refutada, pero para algunas personas es una convicción metaf sica demasiado arraigada como para abandonarla. 28 B. Russell "Our knowledge of the external world", Routledge, Londres, 1993, p

38 3. Campos y principo de contigüidad "Las teorías de campos... se formularon por primera vez en la mecánica de los medios continuos: acústica, hidrodinámica, teoría de la elasticidad. Allí, efectivamente, no era importante si la materia era concebida en principio como un continuo o como teniendo una estructura atómica. En el último caso, el tratamiento como continuo era desde el punto de vista empírico una buena aproximación, y así es como interpretamos hoy estas teorías.la creencia en una mecánica de masas puntuales con acciones a distancia permaneció como una fase transitoria de la física. Aún desde el análisis de la electrodinámica por Faraday y su formulación matemática por Maxxwell, las fuerzas mismas fueron consideradas una realidad física con una dinámica interna, es decir, un campo. Por vez primera el espacio y el tiempo se describieron como un continuo tetradimensional y la dinámica se describió por medio de un sistema de ecuaciones a derivadas parciales hiperbólicas." Carl von Weizsacker, Thomas Gornitz y Holger Lyre en "The structure of Physics", Springer, Dodrecht, Holanda, Además de cuerpos materiales, en el espacio f sico hallamos campos. A diferencia de los cuerpos, en general los campos no se pueden utilizar para definir marcos de referencia de espacio y tiempo. Los campos, también a diferencia de los cuerpos materiales, no tienen efectos directos sobre nuestros sentidos, son intangibles: sus propiedades se estudian a partir del comportamiento de los cuerpos, tangibles y ponderables, sobre los cuales se presume que actúan esos campos. Se conviene en que dos campos son f sicamente idénticos si su efecto sobre el mismo cuerpo de prueba es el mismo en cada punto del espacio donde se ubique dicho cuerpo. Por tanto los campos, a diferencia de las partículas, no se encuentran localizados sino que se encuentran distribuidos en el espacio. Los campos se detectan y se pueden estudiar midiendo las fuerzas que esos campos producen en cuerpos de prueba, o sea, en última instancia determinando sus efectos sobre el movimiento de los cuerpos. Esos cuerpos de prueba se introducen en la región ocupada por el campo con el fin de estudiarlo y por lo menos en principio, poder determinarlo en cada punto de esa región. Por este motivo las características de los cuerpos de prueba deben ser tales que la introducción de uno de esos cuerpos no debe modificar significativamente el campo. Si se estudia un campo gravitatorio debido a un sistemas de masas, como cuerpo de prueba se debe utilizar uno cuya masa sea lo suficientemente pequeña como para no alterar la evolución en el tiempo y en el espacio de la configuración de los cuerpos que se consideran la fuente del campo, puesto que si así no fuera, dicha alteración alteraría el campo que se desea medir. Por ejemplo, un satélite artificial es un buen cuerpo de prueba para estudiar el campo gravitatorio debido al sol, los planetas y la luna en una región relativamente próxima a la tierra, pero un objeto cuya masa fuera similar a la de la luna no lo sería. Lo mismo ocurre en relación con el campo eléctrico estático, cuyas fuentes se encuentran en un sistema de cargas. La carga de prueba debe ser lo bastante pequeña como para que el campo que produce no altere la evolución de las cargas del sistema cuyo campo interesa estudiar. Los campos de fuerza se pueden clasificar en conservativos y no conservativos, a partir del trabajo que el campo realiza sobre un cuerpo de prueba cuando este último se 38

39 desplaza sobre una curva orientada que conecta dos puntos cualesquiera y es lo bastante regular. Para calcular el trabajo se consideran las componentes de la fuerza tangentes a la curva en cada punto de ésta. Se elige un conjunto finito de puntos sobre la curva considerada, incluyendo los puntos extremos inicial y final. Se aproxima la curva mediante la poligonal definida por esos puntos. Se multiplica la componente tangencial de la fuerza en el punto inicial de cada segmento de la poligonal por la longitud del segmento y se suma sobre todos los segmentos. A medida que se eligen más puntos y más próximos, las sumas correspondientes se aproximan a un número real que por definición es el trabajo que el campo de fuerzas realiza sobre el cuerpo de prueba cuando éste recorre la curva. Cuando el trabajo realizado es el mismo sobre todas las curvas orientadas que conectan un punto inicial con otro final cualesquiera, el campo se denomina conservativo. En caso contrario es no conservativo. Cuando el campo de fuerzas es conservativo posee un potencial, es decir, se puede hallar una función escalar definida en cada punto del espacio tal que a partir de ella se pueden calcular las fuerzas mediante un operador vectorial adecuado (el operador gradiente). Y si un campo de fuerza posee un potencial, es conservativo. $1 Campos en mecánica newtoniana de partículas El concepto de campo aparece ya en la mecánica clásica, newtoniana, en la que se usa ese concepto para describir la fuerza de interacción entre partículas. Se postula que cada partícula crea un campo alrededor de sí misma, campo que es capaz de ejercer una fuerza sobre otra partícula que allí se encuentre. Cuando el campo de fuerzas que actúa sobre una partícula dada es conservativo, la energía definida como la suma de la energía cinética y el potencial (denominado energía potencial en este caso) se mantiene constante. Este es el principio de conservación de la energía. La ley de atracción gravitatoria de Newton puede interpretarse en términos de campos de fuerza. Consideremos una masa M que se puede considerar puntual y ubiquemos en ella el origen de coordenadas a partir del cual medimos las distancias a los puntos del espacio. Si m es una masa de prueba situada a una distancia r del origen, y si e r es un vector de longitud unidad orientado radialmente alejándose del origen, atracción sobre la masa de prueba viene dada por:. m M ( M,. la fuerza de 3(r) = -G er = m. - G - er = m g g(r) r 2 r- v ' y El campo g(r) posee simetría esférica: está orientado radialmente, dirigido hacia el origen, y su magnitud es la misma en todos los puntos de la superficie de una esfera de radio r. En este caso el operador gradiente se reduce a - ( ) - r. dr - ( ) d ( Gg M ^ _ dp(r) - - ( ) Como g(r) = e r = e r, resulta que g(r) posee un potencial dr V r y dr <p(r) = -G M y por tanto es un campo conservativo. 39

40 La segunda ley de Newton m a = F para el movimiento de la masa de prueba adopta una forma independiente de dicha masa: a(r) = -g(r) Es decir m = m = m \ - ((r ) e dt dt 2 g ^ dr r ) El teorema de conservación de la energía para la partícula de masa m moviéndose con velocidad v en el campo de potencial gravitatorio (p(r) creado por la masa M adopta la forma m v 2 +$(r) = E 2 En esta expresión $(r) = m g (p(r) es la energía potencial gravitatoria de la masa y E es su energía, que permanece constante. La conservación de la energía puede extenderse a un sistema de partículas sometidas a fuerzas conservativas externas y de interacción entre las partículas del sistema. La suma de las energías cinéticas de las partículas del sistema y la energía potencial del mismo permanece constante. El movimiento de un cuerpo relativo a un marco no inercial Ñ se describe, como vimos en la sección precedente, mediante una modificación de la segunda ley de Newton: m a' = F - m W La fuerza de inercia - m W, al estar definida para cada punto del espacio, puede interpretarse como un campo de fuerzas proporcional a la masa inercial del cuerpo cuyo movimiento se estudia. Cuando W resulta independiente del tiempo y de la posición, como ocurre cuando Ñ se mueve con movimiento rectilíneo uniformemente acelerado respecto del marco inercial K, el campo de fuerzas de inercia es análogo al campo de fuerzas gravitatorio en una región lo bastante pequeña como para que g(r) se pueda considerar a su vez independiente de la posición. Esta analogía resulta tanto más sorprendente cuando se tiene en cuenta la equivalencia de la masa inercial y la masa gravitatoria, m g = m La reflexión sobre este hecho conduce, según se verá posteriormente, a un nuevo punto de vista sobre la gravitación: el de la teoría generalizada de la relatividad. 3.2 Campos en mecánica de medios continuos y electrodinámica: la versión fuerte del principio de contigüidad. No obstante las consideraciones sobre los campos efectuadas previamente en esta sección, tanto en mecánica clásica de partículas como en mecánica de cuerpos rígidos, se trabaja en condiciones en las que se puede considerar instantánea la propagación de las perturbaciones. En este caso el concepto de campo es conveniente pero posiblemente no es indispensable para estudiar el movimiento de un sistema de partículas o de un cuerpo rígido. Muy distinta es la situación en mecánica de medios continuos, en ramas como la teoría de la elasticidad dinámica o la acústica. El estudio de los fenómenos propios de estas disciplinas no puede llevarse a cabo si no se tiene en cuenta el retardo en la propagación de las perturbaciones en los estados de esfuerzo y deformación locales. Otro tanto ocurre en la teoría electromagnética en condiciones en las que corrientes transitorias de 40

41 muy corta duración o corrientes alternas de frecuencias muy elevadas radian una fracción considerable de la energía del campo hacia el espacio circundante. Cuando se tiene en cuenta la velocidad finita de propagación de las interacciones, cualquier modificación en una partícula se hará sentir siempre un tiempo después sobre cualquier otra, de modo que la fuerza de interacción entre dos partículas no puede depender solamente de sus posiciones en un mismo instante. Si se parte del principio de contigüidad, admitiendo que la interacción es posible solamente entre puntos vecinos en el espacio, es más natural introducir un campo como portador de las modificaciones que se producen en las partículas. El campo puede ser considerado una entidad real, en el siguiente sentido: una modificación en una partícula modifica el campo en su vecindad, esta modificación del campo se propaga (no necesariamente tan rápido como la luz en el vacío, pero si aceptamos la teoría de la relatividad, ciertamente no más rápido que eso) hasta que alcanza a la otra partícula, influyendo sobre ella. Y la modificación que esta última sufre se traslada al campo, se propaga a su vez en el campo y alcanza a la primera partícula. Según esta forma de ver las cosas, las partículas interactúan directamente con los campos, no con otras partículas. Cuando las interacciones entre cuerpos son mediadas por campos cuyas modificaciones 29 se propagan con velocidades finitas, cabe esperar que tanto la tercera ley de Newton (igualdad de acción y reacción) como su ley de gravitación universal no sean válidas. Así estas leyes pierden su validez en el marco de la mecánica relativista. Sin embargo, son muy buenas aproximaciones dentro de los límites de validez de la mecánica newtoniana. Con el desarrollo del concepto de campo, el principio de causalidad clásico tomó la forma dada por el principio de contigüidad. También se lo conoce como principio de acción cerrada, de localidad, o de ausencia de acción a distancia. En forma precisa, en la formulación fuerte del principio se supone que los eventos en un punto P en un instante t depende solamente de los eventos en los puntos de una cierta región, próxima al punto P y que lo contiene en su interior, en un instante previo t - At. A medida que At decrece, las dimensiones de esa "región de influencia" sobre P disminuyen, tendiendo a cero cuando At tiende a cero. Si, como se hace en la teoría de la relatividad, se admite que la velocidad de propagación de las interacciones o las señales se encuentra acotada superiormente (por la velocidad c de la luz en el vacío) el estado en un punto P depende a lo sumo del estado de los puntos en una esfera de radio c At en un instante t - At previo. 3.3 Campos en la teoría de los procesos de transporte de calor y masa: la versión débil del principio de contigüidad. Las ecuaciones de la electrodinámica, la elastodinámica y la acústica son compatibles 29 Cuando dos cargas interactúan a través del campo electromagnético, un cambio de posición en una de ellas se traduce en una variación de la fuerza que actúa sobre la otra en un instante posterior. Por este motivo no cabe esperar que en un instante dado las fuerzas de interacción entre las partículas sean de igual magnitud y dirección, y sentido opuesto, como debería ocurrir de acuerdo con la tercera ley. 41

42 con la formulación fuerte del principio de acción local. Por el contrario, las ecuaciones del transporte de masa y calor (de tipo difusivo) violan la formulación fuerte del principio. Esto se debe a que las soluciones de estas ecuaciones difusivas implican que el efecto de una perturbación localizada en la concentración o en la temperatura, ocurrida en un instante dado, en un instante posterior se habrá propagado a todos los puntos del espacio, no importa cuán alejados se encuentren. Por ejemplo, la ecuación del transporte de masa por difusión, en una dimensión espacial puede escribirse en términos del campo de concentraciones c(t, x) y del coeficiente de. dc ^ d 2 c difusión 4 de cierta sustancia, así: = 4 dt ~ dx 2 Supongamos que para t < 0 la concentración es nula en todas partes en un medio no acotado cuyas abscisas verifican < x <. Si se introduce en forma instantánea, en el instante t = 0 y en el punto x = 0, una masa M de sustancia, entonces el campo de concentraciones para todo instante t > 0 y para 30 todo punto de abscisa x viene dado por : í \ M ;(t, x) =. exp 2V n 4 t x 2 4n-4 t De esta solución se desprende que por pequeño que se tome t > 0 y por grande que sea x en valor absoluto, la concentración correspondiente a ese instante y en ese punto va a ser positiva. En consecuencia las soluciones de esta clase de ecuaciones conllevan una velocidad infinita de propagación de las perturbaciones en la concentración o en la temperatura del medio. Pero como el efecto de la perturbación decrece rápidamente con el aumento de la distancia entre la región perturbada y el punto donde se considera el efecto, en la práctica éste no puede detectarse fuera de una cierta región de influencia finita que depende entonces de la apreciación de los instrumentos de medición. 3.4 El postulado de posibilidad de descripción continua de los fenómenos físicos En cualquiera de sus versiones el principio de contigüidad presupone la posibilidad de una descripción continua en el tiempo y en el espacio. Tanto la física clásica como la física relativista dan por sentado este postulado de continuidad en la descripción. Si se pone en duda su validez, se debe poner en duda el principio de contigüidad, una de las bases tanto de la teoría restringida como de la teoría generalizada de la relatividad. Si se descarta la posibilidad de una descripción ininterrumpida del mundo físico, entonces la formulación más precisa del principio de causalidad en física, es decir, el principio de contigüidad, deja de ser universalmente aplicable. Cuando medimos una cantidad física, obtenemos un conjunto finito de valores numéricos aproximados. Si buscamos relacionar los valores que toman dos cantidades, 30 Esta solución se puede hallar en cualquier libro sobre difusión o transporte de calor, así como en los libros de matemática que dedican al menos una parte al estudio de las ecuaciones en derivadas parciales de tipo parabólico. En el libro clásico de H. Carslawy J. Jaeger "Conduction of heat in solids", Clarendon Press, Oxford, 1976, se puede encontrar un tratamiento exhaustivo del tema. 42

43 como la deformación de una varilla sometida a cargas de tracción diferentes, obtenemos un conjunto finito de pares de valores (deformación, carga). Si medimos la deformación para un conjunto de cargas más numeroso y con valores numéricos más próximos entre sí, obtendremos un conjunto de deformaciones correspondiente, más numeroso y con valores numéricos más próximos entre sí. Al final, la apreciación de los instrumentos de medida pone un límite a este proceso: desde el punto de vista experimental no hay nada más. En algunos casos se puede mejorar la apreciación y en consecuencia se puede obtener un conjunto de resultados más numeroso y denso. Pero suponer que la apreciación de los instrumentos se puede hacer tan pequeña como se desee no es algo que se pueda sustentar ni en evidencia experimental ni en resultados teóricos. Puede ser una 31 suposición muy conveniente para elaborar un modelo, pero ahora se sabe que es falsa. Siempre podemos representar las dependencias físicas tales como la relación entre la carga mecánica y la deformación de una varilla por medio del tipo de funciones conocidas como funciones analíticas. Esta representación presupone que tanto la variable que corresponde a la carga como la variable que corresponde a la deformación pueden tomar cualquier valor real en un continuo numérico, y además requiere un grado muy elevado de regularidad en la relación entre las variables, cosa que escapa a toda experiencia posible. Como señala Scrodinger 32, "suponer que la dependencia física es de este tipo simple, es un paso epistemológico desmesurado y seguramente inaceptable." No obstante las soluciones de las ecuaciones diferenciales ordinarias que expresan en forma matemática las leyes de la mecánica newtoniana de partículas y las soluciones de las ecuaciones a derivadas parciales que expresan en forma matemática las leyes de los campos de la mecánica de medios continuos y de la electrodinámica, poseen por lo general ese grado elevado de regularidad. La dependencia regular entre las variables físicas es una consecuencia de la forma matemática de las leyes. Esta forma matemática surge de conjeturas fundadas y es válida dentro de ciertos límites. Por su origen y por su grado de confirmación, cabe esperar que constituyan modelos adecuados del mundo medio, y efectivamente lo son. Pero en principio no deberíamos esperar que se puedan aplicar sin más al ámbito de lo microscópico o a escala de las galaxias. Además, el mismo mundo medio presenta aspectos que requieren incorporar un grado de irregularidad en el modelado matemático de las leyes que las ecuaciones de la físicamatemática clásica y las figuras inspiradas en la geometrías de Euclides no parecen estar en condiciones de aportar. La descripción de las nubes, las cadenas de montañas, las costas, la estructura de los vórtices durante el movimiento turbulento del agua en ríos y mares, la estructura de la 31 La experiencia y la teoría sugieren que más tarde o más temprano se alcanza un punto en el que el nivel de ruido debido a la dinámica microscópica de la materia impide todo progreso en la mejora de la apreciación. 32 E. Schrodinger, "Ciencia y humanismo", Tusquets, Barcelona, 2 a edición, 1998, p.p

44 turbulencia de la atmósfera, y los relámpagos, no se puede realizar mediante aproximaciones a partir de esferas, conos, rectas y círculos. De ahí la invención en 1975 (por Mandelbrot) y el exuberante desarrollo a partir de ese momento, de la geometría fractal y de temas matemáticos estrechamente relacionados cuyos antecedentes habían sido considerados como curiosidades sin interés para la descripción del mundo físico. Una vez que se dispuso de ordenadores adecuados, el cálculo numérico de las soluciones de las ecuaciones diferenciales no lineales del tipo que puede hallarse en algunos modelos matemáticos de origen mecánico, puso en evidencia que esas 33 soluciones presentan a veces un comportamiento asintótico que parece aleatorio. El estudio de estas propiedades originó una rama de la teoría de sistemas dinámicos, la dinámica caótica, que se vincula naturalmente con la geometría de los fractales a través de los denominados atractores extraños 34. La interpretación generalmente admitida de la mecánica cuántica descarta la posibilidad de una descripción ininterrumpida a nivel microscópico, eliminando de hecho el postulado de continuidad (que es en última instancia un postulado metafísico) y algunas de sus consecuencias, como el concepto de trayectoria de una partícula y su identidad. Puesto que los resultados de las mediciones y las relaciones determinadas experimentalmente entre las variables de un sistema son siempre conjuntos finitos, no hay nada en esto que por sí mismo impida eliminar el postulado de continuidad. No obstante, la descripción del estado y de la evolución de un sistema cuántico de N partículas se puede realizar a partir de la denominada función de estado. En la representación que emplea el tiempo y un espacio de configuraciones construido a partir de las coordenadas espaciales r,...,r N de las partículas, esa función de estado (denominada ahora función de ondas) ^(t,r,...,r N ) es una función en general con valores complejos, de 3.N+1 variables reales (cada vector de posición de una partícula aporta tres coordenadas escalares, de modo que el espacio de configuración posee 3.N dimensiones). Verifica una ecuación de campo que presupone no ya el postulado de descripción continua sino la versión fuerte del principio de contigüidad: la ecuación de Schrodinger. 33 Es decir, cuando el tiempo aumenta a partir de un instante inicial y toma valores lo suficientemente grandes. Puesto que un ordenador es una máquina con un conjunto finito de estados internos y puede cambiar de estado en un conjunto discreto y finito de instantes de tiempo, una especificación rigurosa de la conexión entre la ecuación diferencial y el modelo discreto para el cálculo numérico y la representación gráfica de las soluciones de esa ecuación, es un asunto bastante más complicado de lo que parece a primera vista. Cuando se tiene una dinámica caótica las dificultades aumentan. 34 En la teoría de sistemas dinámicos se representa el estado del sistema mediante un punto perteneciente al denominado espacio de estados del sistema. El espacio de estados es un espacio abstracto con una vecindad definida para cada punto. En las aplicaciones de los sistemas dinámicos en ciencias de la naturaleza se emplea una clase de espacios abstractos conocida como espacios métricos. En un espacio métrico la vecindad se define a partir de una distancia definida entre cada par de puntos del espacio. El conjunto de puntos por los que pasa el sistema durante su evolución se denomina órbita, y la correspondencia entre instantes de tiempo y puntos de la órbita se conoce como trayectoria. Un atractor es un conjunto de puntos en el espacio abstracto de estados del sistema dinámico al cual se aproximan las órbitas que comienzan a partir de puntos lo bastante próximos al atractor (en la denominada cuenca de atracción). Un atractor extraño se puede describir como fractal. 44

45 Si conocemos ^(t 0,r 1v..,r v )para un instante inicial t 0 y las interacciones dentro del sistema y entre el sistema y su ambiente, entonces el campo a valores complejos ^(t,r 1v..,r v ) queda determinado para todo tiempo y para toda configuración del sistema de partículas. Como el dominio de ^ es un espacio multidimensional cuya dimensión puede ser muy elevada (si el sistema consta de 5 partículas, su dimensión es igual a 15, si consta de 100 partículas la dimensión es de 300) se ve que la función de ondas no puede interpretarse como un campo que ocupa el espacio físico, tal como el campo electromagnético, el campo gravitatorio u otros campos materiales. Pero el cuadrado del módulo ^(t,r 1v..,r v ) 2 posee un significado físico bien determinado: es la densidad de probabilidad de encontrar el sistema, en el instante t, en la configuración r,...,r v. En principio el conocimiento de la función de onda permite calcular la probabilidad de los resultados de la medida de una propiedad del sistema, aplicando el operador correspondiente. Un análisis detallado del proceso de medición mecánico-cuántico, empleando la interpretación más admitida tanto del formalismo matemático como de los resultados de los experimentos, conduce a la conclusión de que una descripción ininterrumpida no es posible: en el micro-mundo no existe algo que pueda equipararse con la trayectoria de una partícula en el meso y en el macro-mundo 35 de las mecánicas newtoniana y relativista. 3.5 Reconsideración del principio de causalidad A la luz de la mecánica cuántica la afirmación "todo evento tiene alguna causa" debe refinarse para tener en cuenta las leyes probabilísticas. Se puede decir ahora "el evento concomitante o previo C en la cosa (o parte de una cosa) a, causa el evento E en otra cosa (o en parte de la misma cosa) 5, cuando y solo cuando C genera una transferencia de energía de a hacia 5, de la que resulta E con cierta probabilidad condicionada p = P( / C)" Esto flexibiliza el enunciado del principio de causalidad hasta el punto en que resulta posible que una causa no siempre produzca el efecto esperado. Si la probabilidad condicionada es igual a 1, parecería que este enunciado probabilístico se reduce al determinista clásico. Pero si se admite que un evento con probabilidad 1 puede en teoría no ocurrir, esta interpretación del principio determinista como caso límite del principio probabilista no es aceptable sin un análisis a fondo del concepto de probabilidad a que hace referencia y su conexión con los resultados de la experiencia. Otra observación pertinente llegado este punto en el desarrollo del tema, es que si los procesos causales se producen entre cosas diferentes o entre partes diferentes de una misma cosa, entonces los eventos no suscitados por influencias externas, los eventos que consideramos espontáneos, no tendrían causa identifiable. 35 Un tratamiento actualizado y detallado de la mecánica cuántica y sus problemas, con una exposición cuidadosa de base filosófica y accesible a un amplio círculo de lectores, puede hallarse en el libro de M. Guerra, "El enigma cuántico", coeditado por Grupo Magro y la Universidad Católica del Uruguay, Montevideo,

46 Por ejemplo, la desintegración radioactiva espontánea de algunos núcleos atómicos, o lo que podríamos denominar el "auto-movimiento" de un corpúsculo una vez eyectado desde un núcleo atómico debido a un evento de desintegración. No obstante, si se pueden hallar dos partes distintas en condiciones de intercambiar energía, un evento aparentemente espontáneo podría en realidad ser explicado por la versión probabilista del principio causal. Este es el caso de los dos ejemplos que pusimos: la desintegración radioactiva (por efecto túnel mecánico-cuántico o por formación de un racimo lo suficientemente estable y energético de nucleones como para salir del núcleo en forma clásica) y el auto-movimiento del corpúsculo eyectado del núcleo de alguna de las maneras recién mencionadas. Resignarse a eventos no causados no parece algo comprendido dentro del horizonte de la ciencia. 46

47 4. La electrodinámica clásica "Es difícil hallar una teoría de campos en física clásica o en física moderna que haya tenido un impacto comparable al de la teoría del electromagnetismo y que, al mismo tiempo, tenga una reputación de casi incuestionable validez general. Parece seguro afirmar que desde el punto de vista macro-fisico, la teoría del electromagnetismo es correcta y confiable, y que es útil y adecuada en numerosos ámbitos micro-físicos. Los enunciados precedentes no deben interpretarse en el sentido de que la teoría puede suministrar todas las respuestas en física y en tecnología dentro de los confines de las aplicaciones macroscópicas. Más bien indican confianza en la validez general de las ecuaciones de Maxwell. No obstante, todo problema concreto requiere especificar las propiedades electromagnéticas del medio bajo consideración, tal como se expresan a través de las relaciones constitutivas. Es una opinión generalizada que las discrepancias entre teoría y experimento se han debido al uso de relaciones constitutivas inadecuadas más que a inadecuaciones de las ecuaciones de campo de Maxwell mismas." E. Post, "Formal structure of electromagnetics", North-Holland, Amsterdam, En este capítulo se resumen algunos aspectos de la electrodinámica clásica, la disciplina que aborda el estudio de los campos electromagnéticos y sus fuentes en las cargas, los dipolos magnéticos y las corrientes eléctricas. Las acciones eléctricas y magnéticas se ejercen sobre y entre diferentes cuerpos materiales. Si se admite que no existe acción a distancia, parece razonable suponer, como vimos en el capítulo precedente, que cuando un cuerpo actúa sobre otro debe existir un medio que los une y a través del cual se transmiten las acciones. Si se asume esto, 1 as acciones son siempre acciones de contacto. Pero como las acciones eléctricas y magnéticas subsisten en el vacío, parecería que la existencia de fenómenos electromagnéticos implica, además de una modificación del estado de los cuerpos materiales, una modificación del estado físico del vacío. Esto conduce a introducir el concepto de campo como objeto perteneciente al mundo real. El campo deja de ser un mero concepto auxiliar, conveniente desde la perspectiva del análisis matemático de los fenómenos, como ocurre en la formulación original de la mecánica newtoniana de partículas, y pasa a tener el mismo status que la masa, la carga y la fuerza. Este punto de vista se ve reforzado porque los experimentos sugieren que el equilibrio eléctrico no se establece en forma instantánea. Cuando la distancia entre los cuerpos es lo bastante grande y la duración de un transitorio eléctrico en uno de ellos es lo bastante pequeña, se observa que durante ese transitorio no aparece una modificación detectable en el estado eléctrico del otro cuerpo. Esta modificación aparece después de finalizado el transitorio. Si admitimos que se puede y se debe efectuar una descripción continua de estos sucesos, parece ineludible suponer que entre las modificaciones en el estado eléctrico del primer cuerpo se transmite al vacío y a través de este último alcanzan posteriormente al segundo cuerpo (como ondas electromagnéticas viajeras). El vacío, en la medida en que puede sufrir modificaciones físicas, es lo que los científicos del siglo XIX denominaron éter. El campo electromagnético en una región del espacio vacío se describe dos vectores, un vector eléctrico y un vector magnético. Cada vector se describe por su magnitud, 47

48 dirección y sentido. En cada instante esos dos vectores son asignados a cada punto de la región considerada, resultando así dos campos vectoriales. En general la magnitud, dirección y sentido de estos vectores pueden variar de un punto a otro del espacio, y en el mismo punto, de un instante a otro. La interacción de un campo electromagnético con una partícula depende de una cantidad escalar, la carga, que caracteriza la partícula a los fines de esta interacción, y de una cantidad vectorial, la velocidad de la partícula respecto de un marco de referencia inercial. La carga, es sabido, puede ser positiva, negativa o cero. Esto permite distinguir partículas con carga, como los electrones y los protones, de partículas sin carga como los neutrones. La carga, tomada por separado, permite describir la interacción de la partícula con el campo eléctrico. La velocidad, una característica cinemática, multiplicada por la carga, permite describir la interacción entre la partícula y el campo magnético. El producto de la velocidad por la carga se puede relacionar con la corriente eléctrica. Esta última se mide determinando la cantidad de carga que atraviesa un área por unidad de tiempo, debido al movimiento de un conjunto de partículas. 4.1 Electro-estática, magneto-estática y electrodinámica pre-relativista Consideremos ahora como surgen los campos eléctrico y magnético, comenzando con los campos estacionarios, o sea, que no varían con el paso del tiempo. Comencemos con el hecho siguiente: las cargas eléctricas, positivas o negativas, producen campos eléctricos. Las cargas no dependen del marco de referencia que se emplee para describir el movimiento: son invariantes relativistas 36. Además, las cargas se conservan: si la carga total de un sistema de partículas se modifica, ello ocurre porque se transfiere carga desde el ambiente hacia el sistema o desde el sistema hacia el ambiente. La carga no se crea ni desaparece. Eso no obsta para que en ciertas condiciones una partícula cargada y su antipartícula, que posee la misma carga pero con signo opuesto, se aniquilen entre sí dando origen a fotones muy energéticos (radiación gama) que no poseen carga eléctrica: la carga total era cero antes de la aniquilación y continúa siendo cero después de la misma. La misma conservación de la carga ocurre cuando un fotón gama se transforma en un par formado por electrón negativo y por su antipartícula, el electrón positivo o positrón. Los cuerpos con carga eléctrica producen fuerzas sobre cargas de prueba situadas en su cercanía. La fuerza de origen eléctrico F E (un vector) sobre una carga de prueba depende de la magnitud de la carga q (un escalar) y de una propiedad local del espacio, el campo eléctrico E (un vector). En notación vectorial se tiene: 3 E = q E El campo eléctrico en condiciones estáticas es conservativo, por lo que se puede introducir una energía potencial y un potencial escalar. La fuerza de interacción entre dos partículas con cargas q 1 y q 2 es análoga a la fuerza de atracción gravitatoria, con 36 Con el propósito de completar rápidamente el panorama, se llama la atención sobre leyes muy generales, como la de conservación de la carga, que se mantiene válida aún cuando otras leyes, como la ley de conservación de la masa, se han tenido que abandonar una vez establecidas la física relativista y la física cuántica. 48

49 la diferencia que puede ser atractiva cuando las cargas poseen distinto signo y repulsiva cuando poseen el mismo signo 37 : 3 fi ~ 2 Q2 r A esta fuerza de interacción le corresponde una energía potencial D s ~ =I Q2 r Introduciendo los potenciales electroestáticos p 1 ~ producido por la carga r q 2 enel sitio donde se encuentra q 1 y p 2 ~ producido por q 1 en el sitio donde se encuentra r 1 1 q2, resulta, D TT = ^ Qj (pj + ^ Q2 ( Esta fórmula se puede generalizar para un sistema con un número cualquiera de cargas: = 1 S Qa a a 2 ( a a En esta fórmula p a es el potencial del campo producido por todas las demás cargas en el punto donde se encuentra q a. Descomponiendo un cuerpo cargado extenso en un conjunto finito de elementos de volumen, se puede emplear la fórmula precedente, pasando al límite cuando el número de elementos tiende a infinito y sus dimensiones tienden a cero, para calcular la energía potencial de ese cuerpo debida a su propia distribución de carga: su auto-energía electroestática. Si se trata de una esfera de radio E o y carga total q uniformemente Q 2 distribuida, su auto-energía es proporcional a. Este resultado será retomado en 8.2, E o junto con el concepto de partícula elemental que se desprende de la teoría de la relatividad, para discutir los límites de la aplicación de la electrodinámica clásica. Los cuerpos magnetizados (imanes), en reposo respecto de un sistema de referencia, producen fuerzas sobre otros cuerpos magnetizados y sobre cargas eléctricas en movimiento. No se ha podido hallar hasta el momento cargas magnéticas aisladas (los denominados monopolos magnéticos) de modo que el elemento más simple con propiedades magnéticas es el dipolo magnético. Una corriente eléctrica en forma de espira (si se quiere, circular) se comporta como un dipolo magnético cuando se estudia el campo que produce a una cierta distancia, pero al parecer no todo dipolo magnético consiste en una corriente: el espín es el ejemplo típico. Como consecuencia, no toda interacción entre imanes se puede reducir a una interacción entre corrientes. La fuerza de origen magnético 3 S (un vector) sobre una partícula de carga q que se mueve con velocidad! (un vector) depende del producto de la carga por la velocidad y 37 Esta expresión para la fuerza electroestática, al igual que las expresiones para la energía potencial y el potencial electroestático son igualdades en el sistema gaussiano de unidades físicas. En el sistema internacional se transforman en igualdades luego de multiplicar los segundos miembros por 1 donde E o es la permitividad del vacío. 4 n E o 49

50 de una propiedad local del espacio en la cercanía del cuerpo magnetizado, el campo magnético B (un vector). En notación vectorial se tiene: F B = q (v x B) El símbolo c representa el producto vectorial, en este caso aplicado al par vectorial formado por la velocidad y la inducción magnética. Es un vector perpendicular tanto a la velocidad como al campo, posee una magnitud igual al producto de la magnitud de la velocidad, la magnitud del campo de inducción y el seno del ángulo entre la velocidad y el campo magnético y se orienta en el sentido de avance de un tirabuzón dextrógiro cuando se gira desde el primer vector hacia el segundo vector. Las cargas en movimiento constituyen corrientes eléctricas. Las corrientes eléctricas producen campos magnéticos. La ley de Ampere relaciona el campo magnético con las corrientes eléctricas que lo producen. Las corrientes eléctricas variables en el tiempo producen campos magnéticos variables. A su vez, un campo magnético variable en el tiempo en una región del espacio, induce en esa región un campo eléctrico. En igualdad de las demás condiciones, cuanto más rápida es la variación del campo magnético, tanto más intenso resulta el campo eléctrico inducido. El campo eléctrico inducido por la variación del campo magnético no es conservativo: la fuerza electromotriz, es decir el trabajo realizado por el campo eléctrico inducido sobre una carga positiva de magnitud unidad a lo largo de una curva cerrada, en general no es nulo: es igual a menos la velocidad de variación del flujo de inducción magnética a través de una superficie limitada por la curva. El cálculo del flujo exige orientar la superficie según el sentido positivo asignado a la curva. La forma cuantitativa precisa de esta relación viene dada por la ley de inducción de Faraday. Como consecuencia del signo de menos que aparece en la ley de Faraday, el campo magnético asociado con la corriente eléctrica inducida tiende a oponerse a la variación del campo de inducción que en última instancia le dio origen. Es posible demostrar que si así no fuera, se violaría la ley de conservación de la energía. Por su parte, un campo eléctrico variable en el tiempo en una región, induce a su vez un campo magnético en esa región. También en este caso y en igualdad de las demás condiciones, cuanto más rápida es la variación del campo eléctrico, tanto más intenso resulta el campo magnético inducido por esa variación. Maxwell generalizó la ley de Ampere: además de la conexión ya mencionada entre el campo magnético y el movimiento de partículas cargadas, añadió una conexión entre el campo magnético inducido y la velocidad de variación del campo eléctrico. De esta generalización se desprende que aunque la corriente de partículas cargadas sea nula, la variación temporal del campo eléctrico por sí sola alcanza para generar un campo magnético. A su vez, la variación temporal del campo magnético genera un campo eléctrico. La formulación matemática precisa de estas relaciones entre los campos eléctrico y magnético, perteneciente a la denominada electrodinámica microscópica, muestra que es posible generar ondas electromagnéticas que se propagan en el vacío lejos de las fuentes del campo con velocidad c = 2,99776 c 1o 10 cm/s. 50

51 Cuando el sistema de cargas microscópicas es muy complejo se puede enfocar el electromagnetismo desde un punto de vista macroscópico, menos detallado. El campo electromagnético en una región del espacio ocupada por un medio material se describe entonces mediante un conjunto de cuatro campos (que de momento podemos considerar como si fueran campos vectoriales, aunque como veremos posteriormente en 7.5 en realidad frente a un cambio de marco de referencia inercial sus componentes no se comportan como las de un vector propiamente dicho): a saber dos campos eléctricos, y dos campos magnéticos. Estos cuatro campos se pueden introducir desde el comienzo o se pueden obtener mediante operaciones de tomar promedios sobre un sistema microscópico de partículas cargadas moviéndose en el vacío. Se obtiene así lo que se denomina electrodinámica de medios continuos o electrodinámica macroscópica. Nuevamente se deduce que en un medio continuo se pueden propagar ondas electromagnéticas. Si el medio continuo se puede considerar lineal, homogéneo e isótropo, como es el caso del aire, la descripción de las ondas se simplifica mucho y se puede realizar con dos campos, uno eléctrico y el otro magnético. La confirmación experimental de la predicción sobre la propagación de ondas electromagnéticas en el aire, obtenida a partir de la teoría electromagnética, realizada por Hertz en el último cuarto del siglo 19, sentó las bases de la radiotecnia, la televisión y la técnica de micro-ondas tal como las conocemos en la actualidad. La reducción de la teoría ondulatoria de la luz a la teoría de la propagación de ondas electromagnéticas permitió unificar la óptica con el electromagnetismo. Las fuentes del campo propagado son corrientes eléctricas variables: en última instancia, cargas eléctricas aceleradas. Toda carga acelerada, de acuerdo con la electrodinámica basada en la teoría de Maxwell, radia ondas electromagnéticas en mayor o menor cuantía. Si se trata de una partícula que transita en una órbita cerrada en torno de un centro de fuerza atractivo, como se suponía que era el caso de los electrones del átomo girando alrededor del núcleo atómico, la radiación tiene como consecuencia la disminución de la energía de la partícula, la modificación de su órbita y la aproximación progresiva al centro de fuerza. Una estructura atómica semejante no puede ser estable: si se admite que toda carga acelerada radia, entonces la mecánica de las masas medias no puede ser aplicable al estudio de las estructuras atómicas y moleculares estables, propio de la Química. 4.2 La electrodinámica de los cuerpos en movimiento Desde que Faraday introdujo las líneas de campo emanando de o arribando a una carga eléctrica o un polo magnético, se planteó la cuestión de determinar qué pasaba con esas líneas cuando las cargas o los polos se ponían en movimiento respecto del marco de referencia del laboratorio. Para dar respuesta a estas interrogantes fue necesario esperar a disponer, primero de la teoría electromagnética de Maxwell, y segundo de una extensión de la teoría adecuada para abarcar el caso de cuerpos en movimiento. Una primera versión de esta extensión se debe a Hertz. Una segunda versión se debe a Lorentz. La tercera, y al menos por ahora última versión, es la debida a Einstein. 51

52 Dos generalizaciones empíricas se encuentran en la base de estas tres teorías sobre la electrodinámica de los cuerpos en movimiento: (1) Los fenómenos de inducción (es decir, de génesis de fuerzas electromotrices inducidas) se producen por igual cuando varía el flujo magnético a través de un circuito de alambre conductor inmóvil respecto del laboratorio como cuando el campo magnético no varía respecto del laboratorio pero el circuito se mueve respecto del campo. (2) Las fuerzas electromotrices inducidas dependen solamente de la velocidad relativa entre el circuito móvil y el campo fijo. Solo la interpretación que se les da es diferente según qué teoría se considere. Tanto en la formulación de Hertz como en la de Lorentz, se admite la existencia del éter. La diferencia entre ambas se puede ver con mayor claridad recurriendo a la formulación de los campos de desplazamiento eléctrico D y de inducción magnética B en un 38 cuerpo material, a saber : D = 0 E + P B = p 0 H + M El campo P es la polarización dieléctrica (el momento dipolar eléctrico por unidad de volumen del medio material) mientras que el campo M es la magnetización (momento dipolar magnético por unidad de volumen del medio material). Hertz asigna propiedades semejantes a los campos E y P por un lado, y a H y M por otro: ambos son arrastrados completamente por el cuerpo material en movimiento. Una dificultad que aparece como consecuencia de esta hipótesis es que las ondas electromagnéticas deberían ser arrastradas completamente por un gas en movimiento, no importando su grado de dilución. Los experimentos de Fizeau sobre propagación en medios en movimiento muestran que esto no ocurre: cuando el gas se encuentra lo bastante diluido, la propagación de las ondas electromagnéticas se produce con independencia del flujo del gas. Para eludir esta dificultad Lorentz supone que los campos E y H permanecen fijos al éter, mientras que los campos P y M, ligados a la materia, se mueven arrastrados por ésta. Pese al éxito de esta nueva formulación de la electrodinámica de los cuerpos en movimiento, los resultados negativos de los experimentos del tipo del de Michelson y Morley o de Trouton y Noble sugieren que el éter no existe. En la formulación de Einstein se elimina el éter. Las ecuaciones que describen el campo electromagnético, las ecuaciones de Maxwell son compatibles con el principio de relatividad de Einstein si se supone que poseen la misma formulación matemática 39 respecto de todos los marcos de referencia inerciales. 38 En el sistema internacional de unidades, donde 0 es la permitividad y U 0 la permeabilidad del vacío. 39 Lo cual, entre otras consecuencias, implica que la velocidad de la luz en el vacío posee el mismo valor numérico respecto de todos los marcos de referencia inerciales. 52

53 El campo electromagnético se considera ahora como una unidad y se describe respecto de cualquier marco de referencia inercial estableciendo cómo se transforman sus componentes al pasar de un marco a otro. Las leyes de transformación de los campos muestran que los campos eléctrico y magnético tomados por separado pueden ser nulos respecto de un marco de referencia inercial y no serlo respecto de otro marco distinto. Puesto que el campo electromagnético actúa como un medidor de las interacciones entre los cuerpos materiales, constituye un sistema independiente al que pueden asignarse energía, cantidad de movimiento lineal y cantidad de movimiento angular como a cualquier otro sistema físico. Entonces, cuando el campo se encuentra aislado o cuando el campo y un conjunto de cargas que interactúan con él forman un sistema aislado, cabe esperar que se cumplan las correspondientes leyes de conservación para la energía total, para la cantidad de movimiento lineal total y para la cantidad de movimiento angular total del sistema. Los resultados de los experimentos sobre la presión de la radiación y el éxito en el diseño, construcción y operación de las máquinas eléctricas y los aceleradores de partículas, que involucran estos aspectos del campo electromagnético, confirman lo dicho anteriormente. 4.3 La teoría clásica del electrón Durante la última década del siglo XIX se estudiaron las propiedades físicas de modelos de cuerpos materiales sólidos formados por electrones sometidos a fuerzas elásticas, de origen electroestático, centradas en un punto de equilibrio que se interpretaba como centro de las cargas positivas del átomo (las cargas positivas se consideraban distribuidas como un medio continuo en forma de esfera). Una pregunta que surgía naturalmente era qué pasaba cuando ese ordenamiento de átomos y sus electrones se ponía en movimiento: cómo se modificarían las fuerzas y cómo esta modificación incidiría a su vez sobre las frecuencias de vibración de los electrones. Como una carga en movimiento produce un campo eléctrico variable en un punto dado del espacio, un campo eléctrico variable genera un campo magnético, y un campo magnético en general ejerce una fuerza sobre una carga en movimiento, de todo esto se desprende que, cuando el sistema de cargas se pone en movimiento, aparecen nuevas fuerzas de interacción que se añaden a las electroestáticas. A su vez, si dos polos magnéticos se encuentran en movimiento, pero permanecen en reposo uno respecto del otro, generan un campo magnético variable, el cual a su vez produce un campo eléctrico. Ahora bien, Lorentz mostró que un polo magnético en movimiento, en la presencia de un campo eléctrico, sufre una fuerza, en forma análoga a cómo una carga eléctrica en movimiento sufre una fuerza cuando se encuentra en un campo magnético. Como consecuencia, dos polos magnéticos que se desplazan solidarios ejercen una fuerza eléctrica el uno sobre el otro. Al investigar las transformaciones de las cantidades mecánicas con el movimiento de un cuerpo formado por cargas eléctricas en interacción, Lorentz halló que las leyes de transformación parecían ser mucho más complicadas que las correspondientes a los campos. Debido a ello decidió profundizar en la dinámica de un electrón acelerado 53

54 utilizando como modelo de electrón una porción de medio continuo con una carga eléctrica distribuida y que en reposo respecto del éter adoptaría la forma de una esfera de radio r o (denominado radio clásico del electrón). Para explicar porqué el electrón no estallaba debido a las fuerzas repulsivas de los elementos de carga negativa que lo componían según este modelo, Lorentz, al igual que Abraham antes que él, introdujo en forma de hipótesis unas fuerzas atractivas de origen no eléctrico. Abraham había postulado que esas fuerzas de empaquetadura tomaban valores tales que el electrón mantenía su forma esférica cuando era acelerado respecto del éter. Lorentz se dio cuenta que este postulado conducía a contradicciones y dedujo que el único postulado razonable era exigir que como consecuencia de las fuerzas no eléctricas el electrón se encogiera en la dirección de su movimiento de modo que su dimensión longitudinal pasaría a ser r ( 1 - en lugar de 2 r o, siendo v su c 2 velocidad respecto del éter. Las dimensiones del electrón transversales a su dirección de movimiento se conservarían independientes de la velocidad. Esta contracción había sido sugerida por FitzGerald, varios años antes, para poder explicar el resultado negativo del experimento de Michelson y Morley sin abandonar la idea del éter. o v 2 Una vez hallado el sistema de esfuerzos mecánicos internos que impedía la autodestrucción del electrón, Lorentz encaró el cálculo de la fuerza que cada elemento de volumen cargado ejercía sobre cada uno de los otros elementos, en el caso de un electrón acelerado por un campo eléctrico externo 4^ En este cálculo de la auto-fuerza tuvo en cuenta que cuando el efecto de un elemento de carga se hace sentir sobre otro, el primero se ha desplazado a otra posición respecto del éter. Conectó esta nueva posición con la posición previa mediante un desarrollo en serie de potencias del tiempo que las separa. Refirió el desarrollo en serie a la nueva posición, y lo expresó como suma de términos de posición, de velocidad de cambio de la posición (su aceleración) y de la velocidad de cambio de su aceleración, cortando el desarrollo a partir de este último término. Integrando todas las fuerzas que unos elementos de carga ejercían sobre los demás, halló una expresión para la auto-fuerza total actuante sobre el electrón. Introduciendo el desarrollo en serie de potencias mencionado en la expresión de la fuerza y efectuando algunas aproximaciones adicionales, Lorentz obtuvo una expresión consistente en la suma de dos términos. El primero, generalmente dominante, era proporcional a la aceleración a del electrón respecto del éter, la constante de proporcionalidad siendo negativa e igual a 2 e 2 (en unidades gaussianas). El 3 ^ - c otro término, generalmente de orden inferior respecto del primero, era proporcional a la velocidad de cambio a de esa aceleración. df Además, del cálculo se desprendía que la suma de la auto-fuerza y la fuerza e E debida al campo eléctrico externo E era nula. 4o En el libro de D. Mentzel, "Mathematical Physics", Dover, New York, USA, 1961, pp , se puede hallar un planteo completo y claro de la masa electromagnética y las fuerzas que actúan sobre una carga acelerada. 54

55 Dejando solamente el término dominante de la auto-fuerza y denominando -m 0 a la constante de proporcionalidad mencionada, la ecuación de equilibrio entre la autofuerza y la fuerza externa se podía re-escribir así: m 0 a = e E Pero ésta es una deducción de la segunda ley de Newton para el movimiento de un electrón, con la masa m 0 ~ e2 r 0 c expresada en términos del radio r 0 y la carga e del electrón, junto con la velocidad de la luz c en el éter! El siguiente término en la expresión de la auto-fuerza, así como los términos de órdenes superiores que se obtienen si el desarrollo en serie no se trunca, miden la acumulación de energía electromagnética en el electrón a medida que la velocidad de éste aumenta. Un análisis más detallado del movimiento permitió a Lorentz formular la segunda ley de Newton de esta forma: p = e E siendo p = dt m V 1 - C2 Se advierte que la cantidad de movimiento p del electrón corresponde al de una partícula cuya masa m varía con su velocidad de acuerdo con la ley: m = m 0 > - C2 Este resultado coincide con el que suministra la física relativista para una partícula cualquiera (no necesariamente un electrón) cuando m 0 se interpreta como la denominada masa en reposo. Si bien la deducción electromagnética hecha por Lorentz de la masa inercial m 0 ~ e 2 r 0 c y de la segunda ley de Newton resultaba muy atractiva, la evolución ulterior de la teoría física la alejó mucho de este punto de vista. El modelo del electrón como una porción de medio continuo parece demasiado simple. El electrón se comporta más como un elemento "puntual" que como un cuerpo extenso de un cierto radio r 0 y su masa no parece ser de origen electromagnético. Además, vista desde la perspectiva actual, la deducción de Lorentz es pasible de varias críticas 41. Sea como fuere, la teoría de electrón de Lorentz es un antecedente valioso e inmediato de la teoría de la relatividad. Además, junto con los aportes de Poincaré al principio de relatividad, es una muestra de que a fines del siglo XIX y primeros años del siglo XX el ambiente intelectual estaba ya maduro para un cambio de paradigma. 41 Ver, por ejemplo el libro de J.D.Jackson, "Classical Electrodynamics", 2 edición, Wiley, New York, USA, 1975,pp

56 5. Las ciencias físicas al final del sigo XIX "En /os cwarenfa años ^rev'os a 7900, e/ e/ecfromagnef'smo y /a ópf/'ca ^Weron corre/ac'onados _y exp'cados en _/orma fr'wn/a/ ^por /a feor/a ondw/afor'a asada en /as ecwac'ones de Maxwe//..wesfo qwe /a ex^er/ewc/'a ^rev/'a con /os wovrá/'ewfos ondw/afor'os &a /a 'nvo/wcrado s'empre wn med'o ^ara /a ^ropa^ac'ów de /as ondas, era nafwra/ qwe /os y/szcos aswm'eran qwe /a /wz neces'fa a wn med'o en e/ cwa/ propagarse... Zas ondas sonoras _y ofros fenómenos ondw/afor'os s^m'/ares son wna consecwenc'a de /a mecán'ca c/ásíca: /a existencia de marcos de re/erenc'a ^rm7e ( g7ados respecto de /os cwa/es /os fenómenos son s'mp/es se comprende 'en en férm'nos de mov/'m/'entos mas'vos de/ med'o de propagacton..ero para /as perfwr actones e/ecfromagnéf'cas e/ med'o parec/a verdaderamente eféreo s'n ofra man'/esfacton o propósito qwe soporfar /a propagacton de /as ondas. Cwando Ernston comenzó a pensar acerca de esos aswnfos, ex'sf/an var'as pos/' /7/'dades. 7. Zas ecwac'ones de Maxwe// eran 'ncorrecfas. Za feor/a adecwada de/ e/ecfromagnef'smo de /a ser /nvar/anfe a/o /as frans/ormac'ones de Ga/'/eo. 2. E/pr/'nc/pto de re/afm'dad de Ga/'/eo se ap/'ca a a /a mecánica c/ás'ca, pero e/ e/ecfromagnef'smo pose/a wn marco pr/'v/7e ( g7'ado de re/erenc'a, respecto de/ cwa/ e/ éfer se enconfra a en reposo. H. Ex'sf/a wn pr/'nc/pto de re/afm'dad para am as, mecán'ca c/ás'ca y feor/a e/ecfromagnéf'ca, pero no era e/ pr/'nc/pto de re/afmdad de Ga/'/eo. Esfo /'mp//'car/a /a neces'dad de mod^car /as /eyes de /a mecán'ca. " J. Jackson "Classical electrodynamics", Wiley, New York, Como dijimos en 1.5, el desarrollo de los fundamentos matemáticos de la mecánica clásica requirió y estimuló a su vez el desarrollo del cálculo infinitesimal. La necesidad de contrastar sus predicciones con los resultados de las mediciones motivó la invención y puesta a punto de nuevos procedimientos de medición. La combinación de las leyes mecánicas con métodos matemáticos poderosos y técnicas de medición refinadas mostró un inmenso poder explicativo. Debido a todo esto, hacia 18oo la mecánica newtoniana de partículas se había convertido ya en el paradigma para la interpretación de todos los fenómenos físicos y para el desarrollo del aparato de la física-matemática, incluyendo el electromagnetismo. Pero a finales del siglo XIX, a medida que se iban conociendo los resultados de nuevos experimentos, se hacía cada vez más difícil compatibilizar la mecánica newtoniana con la teoría electromagnética sobre la base del concepto de éter. 5.1 La mecánica newtoniana como súper-teoría física Desde el punto de vista de su trabazón conceptual la física de la segunda mitad del siglo XIX se podía dividir en tres grandes teorías: mecánica, electrodinámica y termodinámica. Se admitía que la mecánica newtoniana debía considerarse como una especie de súper-teoría a la que eventualmente se lograría reducir las otras ramas de la física: 56

57 MECÁNICA NEWTONIANA TEORÍA ELECTROMAGNÉTICA TERMODINÁMICA Las flechas de trazo lleno representan una relación de dominio presumida en esa época. Se suponía que la disciplina a la que llega la flecha debía ser dominada por la disciplina de donde parte la flecha. Los signos de interrogación que aparecen al lado de las flechas expresan el carácter conjetural de esa suposición. Esa relación de dominio debe entenderse como la capacidad de la mecánica newtoniana de dar cuenta tanto de la electrodinámica como de la termodinámica, en el sentido siguiente. En esa época se suponía que los conceptos y leyes, tanto de la electrodinámica como de la termodinámica, se podrían reducir a los conceptos y leyes de la mecánica newtoniana, que las unificaría entonces en un mismo cuerpo de teoría física, basado en las nociones de espacio y tiempo absolutos. Esta suposición se demostró errónea. La electrodinámica resultó ser compatible con la mecánica relativista, cuya formulación requirió la eliminación de los conceptos de espacio y tiempo absolutos, mientras que la termodinámica ha resultado ser compatible con, y ha podido reducirse en parte a la física cuántica. 5.2 El problema del éter En 1880 la electrodinámica ya estaba formulada utilizando los conceptos de campo introducidos por Faraday y desarrollados matemáticamente como un sistema de ecuaciones diferenciales a derivadas parciales (ecuaciones de campo) por Maxwell. Los procesos de transporte de calor y masa también habían sido formulados utilizando ecuaciones de campo. Pero mientras que las ecuaciones de la electrodinámica implicaban una velocidad finita de propagación de los efectos electromagnéticos, las ecuaciones de la difusión de la masa o de la conducción del calor implicaban una velocidad infinita de propagación de los efectos difusivos o caloríficos. Desde el punto de vista de la física pre-relativista, esto último no planteaba ninguna dificultad, puesto que no se pensaba en que la velocidad de propagación de una perturbación tuviera una cota superior. 57

58 Aunque en la actualidad pueda parecer extraño, dada las ideas que tenemos ahora sobre el campo electromagnético, en la época en que Maxwell formuló su teoría tanto él como la mayor parte de los científicos contemporáneos pensaban que el campo electromagnético se propagaba a través de un medio intangible al que llamaron éter, en forma análoga a como las ondas mecánicas se propagan a través de un sólido elástico. El éter pasó a cumplir el rol del espacio absoluto en la formulación original de la mecánica. Luego de la crítica de Mach a los fundamentos de la mecánica, se lo identificó con el marco de referencia correspondiente a las estrellas fijas, dotado de propiedades adecuadas para la propagación de ondas electromagnéticas en ausencia de un medio material. La velocidad de propagación de las ondas electromagnéticas en el vacío, c, que se obtenía a partir de las ecuaciones del campo se interpretaba entonces como la velocidad de propagación respecto del éter. Este último, combinándolo con la idea newtoniana de tiempo absoluto, debería constituir un marco de referencia privilegiado. De acuerdo al principio de relatividad de Galileo de la mecánica newtoniana, todos los marcos inerciales son equivalentes. Siendo el éter uno de ellos, no cabría esperar que a través de experimentos puramente mecánicos se pudiera detectar un movimiento respecto del éter. Pero lo que pone aparte al marco inercial ligado al éter de los demás marcos inerciales son, precisamente, los fenómenos electromagnéticos. Ahora bien, la ecuación de ondas clásica es una consecuencia de las ecuaciones de Maxwell en el vacío, y se verifica para cualquier componente del campo eléctrico o del campo magnético respecto del marco ligado al éter. Entre sus soluciones encontramos ondas planas que se propagan con velocidad c. Si seleccionamos el eje x en dirección de la propagación de un campo escalar <p, la ecuación de ondas para ese campo se reduce a: - = dx c dt Si ahora efectuamos un cambio de coordenadas aplicando una transformación de Galileo, la forma de la ecuación de ondas se modifica radicalmente. El campo 0(t, x) se expresará ahora como una función V(t', x') de las nuevas coordenadas: v(t, x) = V(t', x') Pero, como se desprende de la igualdad precedente, asumimos que sus valores son independientes de las coordenadas de tiempo y espacio: se puede decir que por hipótesis es un invariante respecto de un cambio de coordenadas. Si la velocidad del nuevo marco de referencia respecto del éter es V, se tiene: t' = t x ' = x - V t En términos de las nuevas coordenadas t' y x' la ecuación de ondas adopta la forma: \ -V - 1 d - v = _ 1 d v v c - ) dx' - c - dt' - c - dx'dt' Esta ecuación es diferente a la ecuación de ondas clásica. En ella aparece la velocidad relativa del nuevo marco de referencia respecto del marco original. No obstante el cambio de forma, la nueva ecuación posee como soluciones ondas planas en las coordenadas t' = t y x'. Estas ondas planas se mueven con velocidad u = c -V cuando viajan en el sentido positivo del eje x ', y con velocidad u = c + V cuando lo hacen en sentido opuesto al de dicho eje. 58

59 Si las transformaciones de Galileo son válidas y si la ecuación de ondas clásica es válida respecto de un marco de referencia privilegiado, el éter, entonces debido a la ley de adición de las velocidades implícita en las transformaciones de Galileo debería ser posible detectar un movimiento respecto del éste mediante experimentos que involucren la propagación de campos electromagnéticos. Se concibieron dos tipos de experimentos para intentar una confirmación de la hipótesis del éter. Unos involucran la propagación de ondas electromagnéticas de frecuencias lumínicas, como los efectuados por Fizeau y por Michelson y Morley. Otros no involucran dicha propagación, como el experimento con un capacitor cargado y presumiblemente en movimiento respecto del éter, realizado por Trouton y Noble, y los experimentos de Kaufmann de 19o2, destinados a la determinación experimental de la inercia aparente de un electrón producido por una desintegración radioactiva de un núcleo atómico (desintegración beta) y que se mueve a una velocidad no despreciable respecto de c (hasta o.96 c). En 1851 y 1853 Fizeau midió la pequeña diferencia entre el índice de refracción de la luz en agua en movimiento y en agua en reposo respecto del laboratorio, utilizando un método interferométrico. Sus resultados no coincidieron con lo que se podría haber esperado a partir de la aplicación de la ley de adición de velocidades clásica. No obstante, una aplicación de la ley de adición de velocidades cuando se ve involucrada la propagación de ondas en un medio material es muy discutible 42. Si v es la velocidad del flujo de agua respecto del laboratorio, en lugar de la velocidad compuesta c + v Fizeau halló la velocidad c + (1-1/n 2 ) v, donde n es el índice de refracción del agua. Lorentz logró deducir el coeficiente de convección (1-1/n 2 ) a partir de la idea de un éter estacionario que no se ve afectado por el movimiento de cargas eléctricas a través de él. Como es razonable suponer que la Tierra se desplaza respecto del éter 43, cabría esperar la aparición de ciertos efectos ópticos en el vacío debidos en última instancia a diferencias en los tiempos de propagación de la luz entre dos puntos fijos a nuestro planeta, dependiendo de su estado de movimiento en relación con el éter. Así, cuando un rayo de luz parte de un punto A y alcanza un punto B, regresando luego al punto A, el tiempo total insumido tiene que variar cuando ambos puntos se desplazan conjuntamente respecto del éter sin arrastrarlo, en comparación con el tiempo insumido por el mismo proceso cuando los dos puntos permanecen en reposo respecto del éter. Supongamos que la distancia entre A y B es /. Supongamos que el segmento AB se desplaza con velocidad? respecto del éter, paralelamente a la dirección de la velocidad y con B marchando por delante de A. Entonces el tiempo que insume el viaje de ida y vuelta de un pulso luminoso de A hacia 42 El efecto sería el mismo si la velocidad de movimiento del medio es la misma, para la propagación a través de un medio material cada vez más enrarecido, como el que se puede obtener a partir de un gas. 43 Suponiendo que la Tierra no lo arrastra durante su movimiento, lo cual parece una hipótesis razonable en vista de las peculiares propiedades que se le asignaban al éter. 59

60 B y de B hacia A viene dado por t 1 = 1 -, siendo c la velocidad de la luz c + V c - V respecto del éter, y aplicando la ley de adición de velocidades de Galileo a cada uno de los trayectos. Pero si el segmento AB se mueve con esa misma velocidad V perpendicularmente a la dirección de su velocidad, el tiempo insumido en un viaja de ida y vuelta de un pulso luminoso es ahora, aplicando la ley de adición de velocidades y teniendo en cuenta la simetría de los viajes de ida y vuelta: 1 2 = Vc 2 - V 2 ( \ La diferencia de tiempos es entonces t = c Suponiendo que 1+V - V c V2, y V es pequeña respecto de la unidad, desarrollando en serie de c l V 2 potencias se obtiene la siguiente aproximación: t = c c 2 Michelson y Morley pusieron en práctica en 1881 una idea que había sido adelantada ya por Maxwell. Midieron la diferencia de fase entre dos haces de luz coherentes, provenientes de la misma fuente, que en una parte de su trayecto hacen un viaje de ida y vuelta por caminos perpendiculares entre sí. Los caminos de luz perpendiculares entre sí que caracterizan el aparato de Michelson y Morley están destinados a producir una diferencia de tiempos que al modificarse produce un corrimiento en las franjas de interferencia que se producen al superponerse los dos haces al final del camino. Para comparar los diferentes casos posibles, el aparato flotaba en un tanque de mercurio y podía rotar muy lentamente. Este es el único tipo de experimento óptico lo bastante sensible como para detectar el efecto debido al éter, que es un efecto de segundo orden: V 2 depende como vimos de -. Esperaban que al rotar el aparato 90 o se produciría un c 2 desplazamiento en las franjas de interferencia, excepto si la Tierra se encontrara muy próxima al reposo respecto del éter. Para evitar esta última situación, repitieron el experimento en distintas épocas del año, en las que la velocidad de desplazamiento de nuestro planeta respecto del sol va adoptando direcciones muy diferentes. Repitieron todos los experimentos en 1887, utilizando un aparato modificado para obtener una mayor sensibilidad, obteniendo resultados negativos en ambas instancias. En 1924 Miller volvió a efectuar el experimento e informó esta vez un efecto positivo (una velocidad de 10 km/s de la Tierra respecto del éter). El tema fue retomado por Joos, trabajando en la planta de la empresa Zeiss en Jena, utilizando un diseño de interferómetro extremadamente sensible. Los experimentos de Joos indican que si hay un efecto positivo, este es menor que una milésima parte del ancho de una franja de interferencia. El experimento de Trouton y Noble se basa en los estudios de FitzGerald acerca de los fenómenos que se deberían producir cuando un capacitor cargado es arrastrado a través del éter debido al movimiento de la Tierra. Para simplificar, consideremos una carga eléctrica en movimiento respecto del éter. Produce un campo magnético en sus 60

61 alrededores. Si hay otra carga eléctrica próxima a la primera y que se mueve en forma solidaria con ella, siempre que la velocidad de movimiento de la segunda carga no sea paralela al campo que actúa sobre esa carga, aparecerá una fuerza de origen magnético sobre esta segunda carga. Si las dos cargas, iguales pero de signo opuesto y se encuentran fijas en un sólido, formando un dipolo, este dipolo sufre un momento de torsión que tiende a girar las cargas hasta que el segmento de recta que las une se dispone perpendicular a la dirección de la velocidad de movimiento respecto del marco de referencia preferencial. Lo mismo cabría esperar cuando las cargas iguales y opuestas se encuentran distribuidas en las placas de un capacitor, el cual tendería a rotar hasta que las placas quedaran paralelas a la velocidad de movimiento respecto del éter. Si el capacitor se encuentra inicialmente descargado y se desplaza con sus placas paralelas a la dirección del movimiento, FitzGerald demostró que, admitiendo la teoría del éter, en el momento de cargarlo y almacenar así la energía magnética correspondiente al campo asociado a las cargas en movimiento, se debería producir un tirón mecánico sobre el capacitor análogo al que se produciría sobre un cuerpo situado en la superficie de nuestro planeta si su masa aumentara bruscamente de magnitud. No se pudo medir ni el momento de torsión ni el tirón mecánico, pese a lo cuidadoso de los experimentos de Trouton y Noble. Por su parte los experimentos de Kaufmann involucraban acciones de campos eléctricos y magnéticos sobre los electrones provenientes de desintegraciones beta, y de ellos resultaba una variación de la masa inercial con la velocidad que difería en cerca de un 2o % respecto de las predicciones de Abraham, obtenidas aplicando la teoría del éter a un modelo de electrón rígido basado en la electrodinámica clásica. Todos los experimentos que se llevaron a cabo arrojaron resultados negativos: no hay evidencia experimental que apoye la suposición acerca de la existencia de un marco de referencia preferente para el electromagnetismo. Como dijo Whittaker en su historia de la electrodinámica clásica 44, el cuerpo Alfa no parece existir. Esta situación desnuda una contradicción entre la mecánica newtoniana y la electrodinámica clásica que la teoría del éter había permitido eludir: o bien la mecánica clásica es correcta y es necesario reformular la teoría electromagnética, o bien esta última es correcta y es necesario revisar la mecánica. Pero las dos teorías no son compatibles. Intentando compatibilizar la electrodinámica con un marco de referencia absoluto, Lorentz introdujo la hipótesis de un espacio y un tiempo locales dependientes del estado de movimiento de los cuerpos respecto del éter. Los instantes de tiempo y las coordenadas de posición de un evento se conectaban entre sí mediante las así llamadas transformaciones de Lorentz. Los resultados negativos de los experimentos de Michelson y Morley y de Trouton y Noble, así como la variación de la masa con la velocidad en los experimentos de Kaufmann 45 se pueden explicar a partir de las hipótesis efectuadas por Lorentz sin descartar el éter. 44 E. Whittaker, "A history of the theories of aether and electricity", volumen II, Thomas Nelson & Sons, Londres, UK, Para explicar cuantitativamente los resultados de Kaufmann, Lorentz utilizó un modelo de electrón que se contrae en la dirección del movimiento, en lugar de permanecer rígido como había supuesto Abraham. 61

62 Partiendo de un punto de vista muy diferente, Einstein 46 dedujo las transformaciones de Lorentz a partir de un nuevo principio de relatividad que permitió compatibilizar la mecánica con la electrodinámica modificando radicalmente la mecánica newtoniana. 47 En relación con las relaciones de compatibilidad de las teorías físicas, David Hilbert llamó la atención sobre lo siguiente: no es suficiente que la estructura de una teoría física, tal como la mecánica, sea internamente consistente, sino que además sus proposiciones no deben contradecir las de las teorías de campos vecinos, como lo es la teoría electromagnética en el caso de la mecánica. Este requerimiento epistemológico de compatibilidad, también se denominada consistencia externa 48 o coherencia explicativa 49. Si se admite que las subdivisiones del conocimiento científico son en buena medida convencionales y que hay una unidad subyacente, entonces el requerimiento de compatibilidad debería extenderse a todas las teorías científicas. 5.3 La ecuación de ondas clásica: la tridimensionalidad del espacio físico y la evolución de seres inteligentes Una consecuencia de las ecuaciones de Maxwell es que las componentes de los campos que se propagan en el vacío deben verificar una ecuación de onda clásica. Esta ecuación verifica el principio de localidad en su versión fuerte, tal como fue planteado en el capítulo 3 de este trabajo. Pero resulta que del análisis de las soluciones de la ecuación de onda se desprende que la versión fuerte del principio de localidad encierra a su vez dos variantes, dependiendo del número de dimensiones del espacio físico, y esas variantes parecen tener implicaciones epistemológicas muy diferentes. Para ver esto, supongamos una propagación en el vacío, a partir de un punto M en el cual, en un instante inicial t 0 saltó una chispa. En el espacio físico tridimensional la ecuación de ondas clásicas presenta, para un caso como éste, dos soluciones, que corresponden a ondas que se propagan con velocidad c 50. Una de ellas, denominada solución adelantada, se puede interpretar como una perturbación en forma de cáscara esférica con centro en el punto mencionado y que converge hacia él a medida que transcurre el tiempo. 46 También las dedujo Poincaré aplicando un principio de relatividad. 47 En su trabajo "Axiomatisches Denken" de 1918, (reimpreso en "Gesammelte Abhandlugen", No 3, Springer, Berlín, 1935). 48 M.Bunge, "La investigación científica", Siglo XXI Eds., Méjico, P.Thagard, "The best explanation criteria for theory choice", Journal of Philosophy, No 75, pp 76-92, Una discusión sobre las soluciones de la ecuación de ondas clásica en una, dos, tres y en general n dimensiones espaciales puede encontrarse, por ejemplo, en el volumen 2 del libro de R. Courant y D. Hilbert "Methods of mathematical physics", Interscience, New York, 1962; o en E. Copson, "Partial differential equations", Cambridge University Press, Cambridge, U. K.,

63 En ese caso el punto actuaría como un sumidero respecto del campo y no como causa del mismo (que se encontraría en otra parte) por lo cual se debe descartar esta solución. La otra, denominada solución retardada, corresponde a una perturbación, también en forma de cáscara esférica centrada en el punto donde salta la chispa, pero que diverge a partir de ese punto, punto que respecto de esta solución puede ser considerado como una fuente del campo. Esta solución retardada debe ser retenida sobre la base del principio de causalidad, si la chispa se asume como causa y la cáscara esférica como efecto. Consideremos ahora un punto cualquiera P, siendo d (P, M) la distancia entre el punto donde se produce la chispa y el punto donde se estudia la solución. La distancia que recorre la perturbación propagada desde el instante t o en el que se produce la chispa hasta un instante posterior t es c (t-t o ). Si c (t-t o ) < d (P, M) el campo producido por la chispa en el punto P es nulo. También es nulo si c (t-to) > d (P, M). Solo cuando c (t-to) = d (P, M) la respuesta en P es diferente de cero: corresponde al pasaje de la cáscara esférica por ese punto. Cuando t es anterior a t o la respuesta es nula en todo punto del espacio, puesto que la chispa todavía no se produjo. Debido a la linealidad de la ecuación de ondas clásica, si en lugar de una chispa instantánea, en M se produce una perturbación compleja y duradera, esa perturbación localizada produce la propagación de una onda esférica duradera que en el instante to + (d (P, M) / c) reproduce, atenuado por el efecto de la distancia según el factor 1/ d (p, M), el valor que tenía la perturbación en el punto fuente M en el instante t o. Así pues, cualquier historia de una fuente puntual produce un campo a una cierta distancia que reproduce la variación temporal de la fuente: cuando miramos un objeto distante, si nuestros ojos son lo bastante agudos y el efecto de la atmósfera interpuesta es lo bastante tenue, en principio podemos ver exactamente como se está comportando. Este efecto no se conserva si el espacio físico tuviera solo dos dimensiones, en lugar de tres. En este caso la solución retardada de la ecuación de ondas correspondiente a una chispa instantánea producida en un punto M en el instante t o no es una perturbación limitada a una circunferencia centrada en M y de radio c (t- t o ), sino que consiste en una perturbación que ocupa también el interior del círculo. Aparece así un efecto de coa o efecto de estela que se propaga acompañando al frente de onda circular desde el lugar donde se produjo la chispa hacia afuera. Para todo instante t posterior a t o y para todo punto P que en el instante t diste de M menos de c (t-t o ), el factor de atenuación en este caso es, en el punto P: 2-c Vc 2 -(f - f o ) 2 - d 2 (.,;) Si t es anterior a t o ese factor es nulo. A medida que t aumenta, el factor de atenuación tiende a cero para un punto P fijo. Al igual que en un mundo tridimensional, la linealidad de la ecuación de ondas en uno bidimensional tiene como consecuencia que el campo propagado correspondiente a una sucesión de chispas producidas en M en diferentes instantes t o es igual a la superposición de los campos que cada chispa produciría por separado. 63

64 Pero debido al efecto de estela, una perturbación electromagnética previa a la chispa considerada, es decir producida en un instante t s previo al instante t 0, continuará afectando lo que se observa en el punto P, puesto que el factor de propagación es en este último caso y en el punto P:. \ c 2 -(t - t s ) 2 - d 2 (.,M) Si c -(t -1 0 ) es mayor que d (P, M), entonces c -(t - t s )> c -(t -1 0 ) también lo es. Entonces el factor de propagación en el punto P debido a una perturbación en M producida en un instante t s es distinto de cero para todo t s <t 0. Como consecuencia de esto, en un mundo bidimensional, superpuestas a la imagen de un objeto lejano aparecerán las imágenes correspondientes a las trazas fantasmas de todos los objetos que alguna vez ocuparon esa misma posición en el pasado. Las ondas producidas por estos objetos continuarán propagándose desde ese punto en forma indefinida. Lo dicho hasta este momento, si bien concretado para el caso de una chispa y la visión, se aplica a cualquier perturbación que produzca campos que se propaguen de acuerdo con la ecuación de ondas clásica. La audición, basada en perturbaciones que se propagan de acuerdo a esa ecuación de ondas, también se vería sometida al efecto de cola o de estela en un mundo bidimensional: el sonido reverberaría indefinidamente. Sería como vivir en una cámara de ecos. Es posible demostrar que el efecto de estela aparecería también en un espacio de cuatro dimensiones 51. Todo esto sugiere que los mundos bidimensionales o tetra dimensionales no serían favorables para la evolución de seres inteligentes, posiblemente debido a las dificultades en la percepción y en la comunicación, generadas por la superposición de información en el receptor asociada con las trazas fantasmas Estas dimensiones son todas espaciales, el tiempo se halla excluido. Una discusión de estos efectos y su relación con el principio de Huygens de la óptica clásica, puede hallarse en el artículo de M. Gutzwiller "Huygens' principle and the path integral" en S. Lundquist y otros (Eds.) "Path summation: achievements and goals", World Scientific, Singapore, 1988, pp Las consecuencias de la tridimensionalidad del espacio físico ha sido y continúa siendo muy investigada en el marco de la física teórica. Un ejemplo clásico de estas investigaciones es el trabajo de Paul Ehrenfest " Cómo las leyes fundamentales de la física ponen en evidencia que el espacio posee tres dimensiones?", publicado en alemán en los Annalen der Physik, vol. 366, No 5, 1920, pp Si la dimensión del espacio es mayor que tres y se generalizan a ese espacio las leyes de interacción gravitatoria y electroestática, entonces los resultados principales obtenidos hasta este momento se pueden resumir así: (1) La mecánica clásica permite demostrar que las órbitas cerradas, todavía posibles, ya no son estables (cualquier perturbación las destruye) de modo que los sistemas planetarios no pueden formarse y mantenerse tal como los conocemos. Este resultado astronómico continúa verificándose cuando se analiza la estabilidad de las órbitas en el marco de la teoría generalizada de la relatividad. (2) La mecánica cuántica permite concluir que los átomos y moléculas, considerados como configuraciones estables de electrones y núcleos, no pueden existir. Admitiendo estos resultados, podemos concluir que la dimensión del espacio físico debe ser inferior a cuatro. El argumento sobre las trazas fantasmas sugiere que los espacios de una y dos dimensiones también podrían excluirse, con lo cual nos quedaríamos con el espacio tridimensional. 64

65 6. Los conceptos de tiempo y espacio en la teoría restringida de la relatividad "3we grac/as a/ e/ecfromagnef/smo gwe se creó /a re/af/v/dad resfr/ng/da. Zos sa /os de a^we//a época ^wer/an &a//ar wna frans/ormac/ón enfre e/ espac/o y e/ f/empo gwe perm/7/era manfener /nvar/anfes /as ecwac/ones de Max:e// de/ e/ecfromagnef/smo a/ pasar de wn s/sfema de re/erenc/a a ofro en fras/ac/ón wn//orme respecto de/ pr/mero. s.o/ncaré ^w/en, apoyándose en e/ e/ecfromagnef/smo, o f/ene /a frans/ormac/ón correcfa, //amada de a&/ en ade/anfe frans/ormac/ón de Zorenfz-.o/ncaré. fofa frans/ormac/ón perm/ye o fener /a /nvar/anc/a deseada, como /o mwesfra.o/ncaré en sw famosa pw //cac/ón de/ 5 de ywn/o de 'sfe or/gen e/ecfromagnéf/co de /a re/af/v/dad resfr/ng/da, retomada por /nsfe/n, /we ráp/damenfe cr/f/cado. Zos ^/s/cos no adm/f/an gwe wn fenómeno _//s/co parf/cw/ar pwd/era engendrar wna swper-/ey enfre e/ f/empo _y e/ espacto -/a frans/ormac/ón de Zorenfz-.o/ncaré- ap//ca /e a fodas /as /eyes de /a _//s/ca. Era necesar/o, pwes, wscar /deas de ases más genera/es para demosfrar /a famosa frans/ormac/ón, /deas re/er/das esenc/a/menfe a/ espacto y e/ f/empo. n 7970, wn pr/mer fra a/o de /nvesf/gac/ón en esa d/recc/ón _/we rea//zado Jgnafo:s1/. n e/ cwrso de/ s/g/o KK, esas nwevas /deas desembocaron en wna demosfrac/ón de /a frans/ormac/ón de Zorenfz-.o/ncaré asada sobre &/pófes/s /ndepend/enfes de fodofenómeno e/ecfromagnéf/co. " J. Hladik «Pour comprendre simplement les origines et l'évolution de la physique quantique», capítulo 9, Ellipses, Paris, 2oo8. En 19o4 Henri Poincaré, en una famosa conferencia sobre los principios de la física- 52 matemática, analizó el estado de cosas en ese entonces, señaló las dificultades y planteó la posibilidad de construir una nueva mecánica en sustitución de la mecánica clásica. Revisó los numerosos e infructuosos esfuerzos por salvar el paradigma establecido, añadiendo hipótesis tras hipótesis, como la del tiempo local de Lorentz y la contracción de la dimensión de un cuerpo paralelamente a su dirección de movimiento (contracción de Fitz-Gerald). En esa misma conferencia, 53 continuando sus reflexiones sobre la medición del tiempo iniciadas en 1898, Poincaré plantea un método para sincronizar relojes situados en puntos diferentes de un mismo marco de referencia. Esta misma idea es retomada por Einstein, nueve meses después, en su famoso artículo de 19o5 sobre la electrodinámica de los cuerpos en movimiento que se considera el trabajo fundador de la teoría restringida de la relatividad. En un trabajo publicado durante 19o4 54, Poincaré enunció un principio de relatividad estableciendo que todas las leyes físicas, y en particular las ecuaciones matemáticas que describen estas leyes, toman la misma forma general en todos los sistemas de referencia que se encuentren en movimiento relativo rectilíneo y uniforme. 52 H. Poincaré, "Los principios de la física matemática", en Albert Einstein y otros, "Za feor/a de /a re/af/v/dad", Altaya, Barcelona, H. Poincaré, "La mesure du temps", Revue de métaphysique et de morale, 6, pp , H. Poincaré, "L'état actuel et l'avenir de la physique mathématique", Bulletin des Sciences Mathématiques, (2) 28, pp. 3o2-324,19o4. En el libro de J. Hladik ".owr comprendre s/mp/emenf /a f&éor/e de /a re/af/v/fé", Ellipses, París, 2oo5, se puede hallar un estudio histórico muy completo del desarrollo de la teoría restringida y el rol de iniciador que le cupo a Poincaré. 65

66 En el mencionado artículo de 1905 Einstein enuncia un principio de relatividad esencialmente equivalente al propuesto por Poincaré, complementándolo con un postulado sobre la invariancia de la velocidad de la luz. El principio se puede resumir en estos dos enunciados: (a) Las leyes de la electrodinámica (incluyendo un valor constante c para la propagación del campo electromagnético en vacío) y de la mecánica clásica son las mismas en todos los marcos de referencia inerciales 55. (b) No es posible proyectar un experimento que permita definir un estado de movimiento absoluto en el sentido newtoniano. A partir del principio de relatividad, la contradicción entre la mecánica y la electrodinámica fue resuelta finamente en 1905, dando prioridad a la electrodinámica sobre la mecánica y planteando las bases de una nueva mecánica fundada en una revisión radical de los conceptos físicos de tiempo y espacio que se habían aceptado hasta ese momento. 6.1 El principio de relatividad de Einstein, las transformaciones de Lorentz y sus consecuencias cinemáticas Asumiendo que el campo electromagnético no necesita de un medio para propagarse, que es una realidad en sí, se comprende que las ecuaciones de la electrodinámica clásica puedan ser las mismas respecto de cualquier marco de referencia inercial. En ese caso la velocidad c debe ser la misma para cualquier observador, independiente de su estado de movimiento respecto de la fuente del campo: este es el postulado de constancia de la velocidad de la luz introducido por Einstein y parece confirmado por los resultados de los experimentos como el de Michelson-Morley. El principio de relatividad se expresa a través del postulado siguiente: las leyes físicas se deben formular de modo que adopten la misma forma matemática (sean igualmente válidas) en todos los marcos inerciales. El principio de la constancia de la velocidad de la luz podría resultar compatible con el principio de relatividad si éste no se expresara a través de las transformaciones de Galileo: estas últimas implican una ley de adición de velocidades inaplicable en electrodinámica. Para evitar confusiones, resulta conveniente denominar principio de relatividad de Einstein a la combinación del principio de relatividad con postulado de una velocidad máxima de propagación de las interacciones. La mecánica compatible con este principio se denomina mecánica relativista. Reflexionando sobre cómo se mide el tiempo en Física, Einstein se dio cuenta de ciertas hipótesis nojustifícadas por la experiencia que se encuentran en la base del concepto de tiempo absoluto de la mecánica clásica 56. La asignación de instantes de tiempo a diferentes eventos que ocurren en un mismo 55 El sistema utilizado en astronomía se considera un marco inercial. Los demás se muevan con movimiento rectilíneo y uniforme respecto de este sistema, y por tanto los unos respecto de los otros. 56 A. Einstein "La Relatividad. Memorias originales" Emecé, Buenos Aires,

67 lugar respecto de un marco de referencia no presenta problema, al igual que el concepto de simultaneidad de dos acontecimientos que se producen en el mismo punto. El problema aparece cuando se intenta determinar si dos sucesos que se producen en lugares alejados son o no simultáneos, porque para hacer esto es necesario sincronizar los relojes situados en esos lugares. Parece de sentido común suponer que para sincronizar un reloj en A con un reloj alejado en B basta con sincronizar primero un reloj U B situado en A mediante el reloj U A asignado al punto A, y luego transportar el reloj U B desde A hasta B, dejándolo en B y leyendo desde ese momento en adelante el tiempo de B en U B. Esta forma de sincronizar relojes resulta aplicable si ocurre lo siguiente: siempre que dos relojes U B1 y U B2, sincronizados en A, se pueden transportar hasta B por caminos diferentes pero arribando simultáneamente a destino, entonces resultan estar sincronizados en B. Si se admite a priori, puede denominarse postulado del transporte. Si la sincronización no se conserva al llegar a B, cuando los relojes son transportados a partir de A por caminos diferentes, entonces es necesario introducir un método nuevo para sincronizar relojes situados en puntos distantes. El concepto de simultaneidad de eventos que aparece en el artículo de Einstein sobre le electrodinámica de los cuerpos en movimiento, se basa en admitir que el método del transporte no es válido 57 y en sustituirlo por un método basado en el envío de señales entre los puntos cuyos relojes se desea sincronizar. La posibilidad de este segundo método reposa a su vez en una suposición adicional: ninguna cadena causal que comienza en A puede dejar sentir sus efectos en un punto B antes de la llegada de una señal luminosa (onda electromagnética) que es emitida simultáneamente con el inicio de la cadena en A y viaja en el vacío hasta el punto B. Aquí "antes" se refiere a un orden cronológico determinado con un reloj en B, que para esta tarea no necesita estar sincronizado con el reloj de A. En principio se podrían conectar puntos distantes a través de señales de distinta naturaleza, incluso en el vacío, pero este postulado de existencia de un tipo de señal de máxima velocidad de propagación, a través de un enunciado que involucra toda conexión causal posible, singulariza las señales luminosas y las pone aparte de las otras señales posibles. Puesto que la velocidad de la luz parece ser independiente del movimiento de la fuente y la misma para todos los observadores situados en marcos inerciales, Einstein propone un método de sincronización basado en el envío y recepción de señales luminosas. Consideremos dos relojes situados en dos puntos A y B fijos respecto de un marco de referencia K. Supongamos que en el instante t A;1 una señal luminosa parte de A hacia B, se refleja allí y retorna con información sobre el instante t B en el que se produjo la reflexión en B según el reloj allí situado. La señal reflejada arriba al punto A cuando el reloj allí indica el instante t A, 2. Por definición, los relojes están sincronizados cuando tb _ 2 ' (t A,1 + t A,2 ) Dos eventos que ocurren en puntos diferentes de un mismo marco de referencia son simultáneos cuando los relojes locales en los lugares correspondientes marcan el mismo instante de tiempo. 57 Suponía que, en general, las diferencias en las trayectorias elimina el sincronismo de los relojes en el punto de arribo. 67

68 Esta forma de definir sincronismo de relojes se puede re-escribir así: t B -t A1 = t A2 -t B Pero, como señala Einstein en "Sobre la electrodinámica de los cuerpos en movimiento", esto implica la suposición que el "tiempo" que requiere la luz para viajar 58 de A hasta B es igual al "tiempo" que requiere para viajar de B hasta A. Además, es necesario suponer que esta definición de sincronismo se puede aplicar para todos los puntos en reposo en un mismo marco de referencia, sin contradicciones: la relación de sincronismo debe asumirse simétrica (si A está sincronizado con B entonces B está sincronizado con A) y transitiva (si A está sincronizado con B y B lo está con C, entonces A está sincronizado con C). Supongamos ahora que en el punto medio C del segmento que une los puntos A y B se ha colocado una fuente de luz con su correspondiente reloj sincronizado. En un instante dado desde C se emite un destello luminoso que, de acuerdo con lo establecido previamente, alcanza los puntos A y B en forma simultánea. Respecto de un observador en un marco de referencia K' respecto del cual K se encuentra en movimiento paralelamente al segmento AB, las señales luminosas se propagan con la misma velocidad, pero mientras viajan a partir de C, uno de los puntos (A o B) se aleja de la señal que viaja hacia él mientras que el otro punto (B o A) se acerca. Como consecuencia, pese a la simetría geométrica, una de las señales alcanza uno de los extremos del segmento antes que la otra pueda alcanzar el suyo. Así pues, la simultaneidad de dos sucesos que se producen en lugares diferentes es un concepto relativo al observador: dos sucesos que son simultáneos para un observador (K) pueden no serlo para otro observador (K'). Este es el resultado fundamental en relación con el tiempo que se desprende del postulado de la constancia de la velocidad de la luz. Pero si la simultaneidad de dos eventos es relativa al marco de referencia, entonces la ecuación f = t que iguala los instantes en los que se produce un mismo evento en dos marcos de referencia tiene que ser falsa 59. Como la ley de adición de velocidades de Galileo también es falsa, es preciso reexaminar la totalidad de la conexión entre las coordenadas de tiempo y espacio de un mismo evento respecto de dos marcos de referencia inerciales. Las ecuaciones para la transformación del tiempo y las coordenadas espaciales desde el marco K al marco K': (1) Deben mantener invariante su forma al ser invertidas, es decir al regresar del marco K' al marco K invirtiendo el signo de la velocidad relativa V. (2) Deben convertir regiones acotadas de puntos (t,x,y,z) de K en regiones acotadas de puntos (t',x',y',z') dek'. (3) Cuando V tiende a cero la transformación debe tender a la identidad. 58 Einstein "La Relatividad. Memorias originales" Emecé, Buenos Aires, Puesto que de ella se desprende que la simultaneidad de dos eventos es independiente del marco de referencia, es decir, del observador. 68

69 (4) La ley de adición de velocidades resultante de esa transformación debe dejar invariante la velocidad de la luz en el vacío: c = c Es posible demostrar que las restricciones (1) y (2) tomadas en conjunto implican que la transformación deba ser lineal. De la linealidad de la transformación y de (1), (3) y (4) se obtienen las transformaciones de Lorentz. Cuando los marcos inerciales poseen un eje de coordenadas paralelo a la dirección de su movimiento relativo y los orígenes de tiempo y espacio coinciden en un mismo evento (Figura 1), se deducen las expresiones más simples de la transformación de Lorentz: V.t V 2 y = y z = z t '= t - V.x V 2 V Si es despreciable respecto de 1, las fórmulas se reducen transformaciones de c Galileo: x ' = x - V.t y' = y z ' = z t ' = t En el límite de las velocidades bajas respecto de la velocidad de la luz, para todos los fines prácticos el tiempo se comporta como un invariante al pasar de un marco de referencia a otro. Mismo origen para t=t J =0 Z 1, : J i y 1 A Figura 6.1. El marco K' se desplaza con velocidad V respecto del marco K Invirtiendo las fórmulas que conectan K con K' se obtiene: t +- V.x' x' + V.t' x= y = y z = z V 1 - V 2 1- V2 Si un reloj se encuentra fijo al origen de K', entonces x' = 0 para todo t'. 69

70 De la última fórmula se desprende que t = V o bien t': i 1? 2 t < t c Esto significa que un reloj en movimiento respecto de un observador fijo en K, atrasa siempre respecto a un reloj equivalente en reposo respecto del observador 60. Obsérvese que el tiempo t es el que indica un reloj sincronizado en K que en ese instante se encuentra a una distancia x = V t del origen de K. La llegada de los mesones pi al suelo constituye un ejemplo del atraso de un reloj en movimiento. Esos mesones se producen en reacciones nucleares cuando los rayos cósmicos provenientes del espacio exterior chocan con los núcleos de los átomos e iones atmosféricos a unos 20 km de altura. En el laboratorio los mesones pi poseen un tiempo de vida media de 2,55c 10 - s, por lo cual, si viajaran a la velocidad de la luz se desintegrarían la mitad de los mesones pi remanentes cada 7, 6 m de recorrido. Entonces, luego de 20 km deberían de haber transcurrido (2c 10 4 /0, 8) = vidas medias. La fracción que alcanzaría el suelo sería entonces (1/2) r Este número es 750 extraordinariamente pequeño. Se deberían producir 10 mesones para que uno pudiera 80 llegar al suelo. El número de átomos del universo podría ser 10, así que no alcanza la totalidad de sus núcleos para asegurar que un mesón pi llegue al suelo. Qué pasa entonces? Los mesones pueden ser considerados como relojes en movimiento que se desplazan a velocidades próximas a c. Para un observador en el V 2 suelo el reloj del mesón atrasa con un factor 1 - tan pequeño que muchos de ellos c 2 alcanzan el suelo antes de desintegrarse. Sin este atraso relativista un haz de mesones pi se desvanecería luego de 100 m de recorrido. El empleo de grandes aceleradores de partículas permite una confirmación experimental del atraso de un reloj en movimiento. Con un sincrotrón se pueden producir mesones pi con velocidades lo bastante próximas a c como para obtener haces de piones que alcanzan varios centenares de metros a partir del lugar en el que se forman. Supongamos que una varilla está en reposo respecto de K', situada a lo largo del eje x', y que un observador en K' mide su longitud obteniendo x 2 - x 1 = Ax Ahora, K' se mueve respecto de K. Si un observador en K pretende medir la longitud de la varilla sin detenerla, debe determinar con qué puntos x 1 y x 2 del eje x coinciden los extremos de la varilla en un mismo instante t. Entonces considera dos sucesos que respecto de K son simultáneos. Como de las transformaciones de Lorentz se desprende que x 2 - V.t, _ x 1 - V.t x 2 x 1 = / - Restando miembro a miembro se obtiene: 1-60 Un reloj en reposo respecto de un marco de referencia se denomina el reloj del observador para ese marco. 70

71 : = A:' = V A: 1 - V2 o sea A:: 1 V 2 A - A: ' c 2 Una varilla en movimiento resulta más corta que en reposo: los cuerpos en movimiento se acortan. Obsérvese que si bien los sucesos (t, x 1 ) y (t, x 2 ) son simultáneos respecto del marco K, no lo son respecto de K' en el cual la varilla se encuentra en reposo. Retomando el ejemplo de los mesones pi, un observador fijo a los mesones mediría el mismo tiempo de vida media que se determina en el laboratorio. Pero como se mueve a una velocidad V respecto de la atmósfera, los A: = 201m de espesor de esta última para él son A: 1 V 2 ' 1 - A:. Como V se encuentra próxima a c, esta distancia es tan corta que permite que el mimo número de mesones pi que estima el observador fijo a la tierra alcancen el suelo. El resultado es el mismo para ambos observadores. La dilatación del tiempo y el acortamiento de las longitudes en la dirección del movimiento son efectos puramente cinemáticos, debidos a la peculiar forma en la que se interrelacionan tiempo y espacio según el principio de relatividad de Einstein: en todo esto las interacciones entre los cuerpos no tienen relevancia alguna. A partir de las transformaciones de Lorentz se obtienen las siguientes expresiones para la adición de velocidades: v v = - V 2 V 2 v v ( - V v v z V-v : V-v : V-v : v 1 - V2 v:+v v 1+ V-v: v 1+ V-v. v z v 1- V2 1 + V-v. Si v = ^v 2 + v 2 + v; 2 = c entonces v' = ^v^2 + v'2 +v ' 2 = c como cabía esperar. Esto permite explicar el resultado negativo del experimento de Michelson y Morley. Si V es despreciable respecto de c se obtienen las fórmulas de adición de velocidades de la mecánica clásica. Además, la combinación de velocidades inferiores a c siempre da como resultado una velocidad inferior a c. La discrepancia entre los resultados experimentales y la teoría del éter en el caso de los experimentos de Fizeau se explica también mediante la nueva ley de adición de velocidades. Supongamos un medio con índice de refracción n, en este caso agua. c Si la luz en el agua viaja con velocidad v' x = v' = 0 v( = 0 mientras que el n agua se mueve paralelamente al eje x con velocidad V, entonces las componentes de la 71

72 velocidad de la luz respecto del laboratorio vienen dadas por las ecuaciones: c + V 1 ^ H + V H J = 0 -= 0 -x ^ - i H í 1 + c n Se obtiene como aproximación la expresión hallada experimentalmente por Fizeau, incluyendo su coeficiente de convección. Obsérvese que lo que en estos ejemplos se adiciona es una velocidad de movimiento de un cuerpo respecto de un marco de referencia K, con una velocidad -V de movimiento del marco de referencia K respecto de otro marco K' para calcular la velocidad de movimiento de ese mismo cuerpo respecto de K'. Dicho de otra forma, la velocidad de un cuerpo A (que en este caso coincide con el marco K) referida a un marco K' se combina con la velocidad de un cuerpo B respecto de A (es decir, K) para obtener la velocidad de B respecto de K'. Si lo que tenemos es la velocidad de un cuerpo A respecto de un marco K y la velocidad de otro cuerpo B respecto del mismo marco K, entonces la velocidad relativa del cuerpo A respecto del cuerpo B se calcula según la fórmula clásica, porque todas las operaciones se realizan respecto del mismo marco de referencia. Si bien la velocidad c es un límite superior para todas las velocidades que pueden ser alcanzadas por los cuerpos materiales 1, la velocidad relativa de un cuerpo respecto de otro en el mismo marco de referencia puede resultar mayor que c. Lo que ocurre es que de esto no se desprende que exista un cuerpo que pueda moverse respecto de K con esa velocidad mayor que c: no solamente en este caso no lo hay, sino que según la teoría de la relatividad no puede haberlo. 6.2 Homogeneidad del tiempo, homogeneidad e isotropía del espacio y principio de relatividad de Einstein Sobre la base de los postulados de homogeneidad del espacio y el tiempo, y de isotropía del espacio, es posible demostrar la invariancia del intervalo entre dos eventos en forma directa, sin utilizar las transformaciones de Lorentz para luego deducir estas últimas a partir de la invariancia del intervalo. Del postulado de la constancia de la velocidad de la luz se desprende que si el intervalo se anula respecto de K, se anula respecto de K', puesto que los eventos se encuentran conectados por una señal que viaja con velocidad c. Si ds = ^ c 2 dt 2 - dx 2 - dy 2 - dz 2 es el intervalo entre dos eventos respecto de K, eventos que se toman arbitrariamente próximos en el tiempo y en el espacio, y ds' = -y/c 2 dt' 2 - dx' 2 - dy' 2 - dz' 2 es el correspondiente intervalo respecto de K', entonces ds = 0 implica ds' = 0. Como ds y ds' deben ser infinitésimos del mismo orden y se anulan a la vez cabe esperar que sean proporcionales: ds = a ds' 61 Las fórmulas de Lorentz ya sugieren esto, desde que J1 -Y se haría imaginario. Como se desprende del análisis de la sección (9), la dinámica relativista conduce a la misma conclusión. 72

73 El coeficiente de proporcionalidad no puede depender de las coordenadas de tiempo y espacio. Si dependiera de ellas, diferentes puntos del espacio o diferentes instantes de tiempo no serían equivalentes, lo cual violaría el postulado de la homogeneidad del espacio y del tiempo. Tampoco puede depender de la dirección ni del sentido de la velocidad relativa de K' respecto de K, puesto que si así fuera se violaría el postulado de la isotropía del espacio. Entonces a = a( V pero como V V sino que también se verifica ds' = a - ds. Como consecuencia a 2 = 1, es decir, a = ±1 Como se puede suponer que a = a( V) es función continua de resulta que no solo se verifica ds = a - ds' V o bien a = 1o bien a = -1 en todos los casos. Pues si para un valor V de V fuera a = 1 y para otro valor V 2 fuera a = -1, para valores comprendidos entre V y V 2, a = a(f) debería tomar todos los valores entre -1 y +1. Por otra parte, cuando K'=K, debe ser ds' = ds, de modo que si a = a(v) constante, su valor debe ser necesariamente 1. ha de ser Por tanto, si a = a(v )= 1, para todo par de marcos inerciales se verifica la igualdad de los intervalos ds' = ds. De esta última igualdad se desprende que en general As' = As Así pues el intervalo entre eventos es un invariante: es el mismo respecto de todos los marcos de referencia inerciales. A partir de la invariancia del intervalo se pueden deducir las fórmulas de Lorentz. Para hacer esta deducción se trabaja en forma geométrica en el tiempo-espacio de Minkowski. Las transformaciones de coordenadas que dejan invariante el intervalo y conectan dos marcos inerciales K y K' entre sí, cuyos orígenes de coordenadas coinciden, se pueden interpretar como rotaciones en el espacio de cuatro dimensiones. Los coeficientes de la correspondiente matriz de cambio de coordenadas se pueden calcular en términos de la velocidad de un marco respecto del otro y de la velocidad de la luz c 62. Para deducir las transformaciones de Lorentz conviene introducir una coordenada imaginaria T = i - c -1 con lo cual el cuadrado del intervalo entre dos eventos, referidos a un marco K verifica -As = AT + A: + Ay + Az, y respecto de otro marco K'se tiene - As' 2 = AT 2 + A:' 2 + Ay' 2 + Az' 2 Debido a que el intervalo permanece invariante, se verifica para dos eventos dados y sus coordenadas respecto de dos marcos inerciales: AT 2 + A: 2 + Ay 2 + Az 2 = AT 2 + A:' 2 + Ay' 2 + Az' 2 En general se puede suponer que las coordenadas de un evento respecto de K' son funciones regulares y biunívocas de las coordenadas de ese mismo evento respecto de K: T' = T'(T, :, y, z) :' = :'(T, :, y, z) y' = y '(T, :, y, z) z ' = Z'(T, :, y, z) 62 Se puede encontrar una deducción de las transformaciones de Lorentz siguiendo el camino aquí esbozado en L. Landau y E. Lifchitz, "Teor/a de/ Campo", Reverté, Barcelona,

74 T = T(T ', x', y ' z') x = x(t, x', y z') y = y(t, x, y ', z') z = z(t, x', y ' z') Estas son las fórmulas de transformación de coordenadas en el espacio tetradimensional, y equivalen a las transformaciones de Lorentz con la diferencia que implica haber introducido la coordenada temporal imaginaria T = Í c t Partiendo de la igualdad diferencial dt 2 + dx 2 + dy 2 + dz 2 = dt 2 + dx' 2 + dy' 2 + dz' 2 es posible demostrar que todas las derivadas parciales de segundo orden (incluyendo todas las derivadas cruzadas) de esas funciones, respecto de las variables (T,x,y,z), son nulas. Como consecuencia, se puede demostrar que las coordenadas respecto de cualquier evento respecto de K' se pueden expresar como la suma de una traslación más una rotación en términos de las coordenadas de ese mismo evento respecto de K 6!. La traslación no presenta interés puesto que simplemente ubica respecto de K' el origen de coordenadas de K, de modo que se puede ignorar suponiendo que ambos orígenes de coordenadas coinciden. Queda así la rotación en cuatro dimensiones, que se puede descomponer en seis rotaciones en los planos xy, yz, zx, TX,?y, y?z, en forma análoga a como una rotación en el espacio tridimensional se puede resolver en tres rotaciones en los planos xy, yz zx. Las rotaciones en los planos xy, yz zx transforman solamente las coordenadas espaciales sin involucrar el tiempo, por lo cual corresponden a las rotaciones ordinarias en el espacio físico y no presentan interés. Lo más sencillo es analizar una rotación en uno de los planos TX,?y, o?z. Consideremos entonces una rotación en el plano TX, suponiendo que las coordenadas y,z permanecen incambiadas: esta situación corresponde al caso en el que el marco K' se traslada respecto de K con velocidad uniforme V de modo que x'yx son paralelos. Si p es el ángulo de rotación, entonces: x = x' cos p - T senp T = x' senp + T cos p Si el origen de K' se mueve con velocidad V respecto de K, poniendo x'=0 en las fórmulas de rotación se obtiene x = -T' senp T = T cosp x de donde = -tgp T x? Como T = Í c t y en este caso = V, resulta que tgp = Í t c De esta última fórmula y de relaciones trigonométricas bien conocidas se desprende que senp = r c ÍV_ y cosp = 1-S,.V,,.v, x - Í T x + Í x Sustituyendo en las fórmulas para la rotación x =. c c T = 1-63 Ver J.Synge "Relativity: the special theory", North-Holland, Amsterdam, 2 a edición, 1965, pp

75 Regresando al tiempo real: Estas son las fórmulas de Lorentz. :' + V -1' 1- V 2 V t + t : V 2 y = y (=( 6.3 Formulación de la teoría de la relatividad independiente del postulado de constancia de la velocidad de la luz: la constante de estructura del tiempo-espacio Desde el punto de vista histórico la relatividad restringida surgió en íntima conexión con la teoría electromagnética. La deducción de las transformaciones de Lorentz vista en 6.2 se apoya en la invariancia de la velocidad de propagación de las ondas electromagnéticas al pasar de un marco inercial a otro. No obstante, las transformaciones en sí mismas conectan las coordenadas de tiempo y espacio de un mismo evento respecto a marcos de referencia inerciales: según el principio de relatividad son aplicables a todas las leyes físicas, más allá de su origen electromagnético. Por este motivo, durante buena parte del siglo pasado se realizaron numerosos esfuerzos tendientes a independizar la deducción de las transformaciones de Lorentz de hipótesis vinculadas con fenómenos electromagnéticos. Las demostraciones se fueron depurando progresivamente, desde el planteo inicial debido a Poincaré (1904 y 1905), pasando por los trabajos de Ignatowski (1910), Frank y Rothe (1911), Le Roy (1935), Escanglon (1936) y Lalan (1936) hasta adquirir su forma actual. 64 Las bases para esta deducción se encuentran en cuatro postulados debidos a Poincaré: (a) El espacio es homogéneo e isótropo. (b) El tiempo es homogéneo. (c) Existen marcos de referencia respecto de los cuales las leyes físicas adoptan la misma forma (marcos inerciales). (d) Las conexiones causales se conservan al pasar de un marco de referencia inercial a otro. Actualmente es posible obtener las transformaciones de Lorentz sobre la base de estos cuatro postulados. En lugar de la velocidad de la luz aparece una velocidad límite que no puede ser sobrepasada por los corpúsculos durante su movimiento, y solamente puede ser alcanzada por corpúsculos de masa nula. Aplicando el principio (c) de relatividad de Poincaré, esa velocidad límite resulta la misma respecto de todos los marcos de referencia inerciales. Es una constante universal que se suele denominar constante de estructura del espacio-tiempo. 64 Ver J. Hladik y M. Chrysos, "/ntrodmction L /a re/ativité restreinte", Ellipses, París,

76 Si, como pensaba Louis de Broglie, no existieran corpúsculos de masa nula, o si experimentos más precisos mostraran que el postulado de invariancia de la velocidad de la luz en el vacío se puede considerar solamente como una primera aproximación a una realidad más compleja, la deducción de las transformaciones de Lorentz con c sustituida por la mencionada constante de estructura del tiempo-espacio mantendría su validez. A continuación, a vía de ejemplo, presentamos una breve deducción 65 para el caso en que el eje x' del marco inercial K' se mueve sobre el eje x del marco inercial K, teniendo ambos ejes la misma orientación. Supongamos que la velocidad con que K' se desplaza respecto de K es V, y que los relojes en cada marco se encuentran sincronizados (por ejemplo trasladando en forma cuasi-estática a diferentes puntos relojes previamente sincronizados en un mismo punto). En lo que sigue trabajaremos con una sola coordenada espacial. Aunque con alguna complicación adicional, el método se puede extender a tres dimensiones 66. Supongamos que las coordenadas de espacio-tiempo de un mismo evento respecto de K ydek' son (x, t) y (x', t') respectivamente. En general cabe esperar que estas coordenadas se relacionen mediante funciones regulares del tipo: x' = f (x, t; V) t' = g(x, t; V) Considerando eventos próximos y trabajando con diferenciales, se tiene: dx' = f (x, t; V) dx + f (x, t; V) dt dx dt dt ' = ^ g (x, t; V ) dx + d g (x, t; V ) dt dx dt De la homogeneidad del espacio y del tiempo se desprende que las derivadas parciales dependen solamente de V. Cuando dx' = 0, entonces dx = V dt relación y de la expresión para dx' en función de dx y de dt se desprende que: V f f (x, t; V ) + f (x, t; V ) = 0 dx dt Como consecuencia: dx' = f (x,t; V) (dx - V dt) = /(V) (dx - V dt) dx Como los ejes x y x' poseen la misma orientación, YV )> 0 De esta última 65 Esta deducción se basa en el trabajo de Edouard Le Roy, "Sur les formules de Lorentz", Comptes Rendus, vol 202, 1936, pp Al parecer la demostración se le ocurrió a Le Roy (Profesor en el College de France) durante una conversación con Ramón Salas Edwards (Profesor en la Universidad de Chile), mantenida a comienzos de la década de J. Ferrari "Fundamentos de relatividad especial", DPE, UDELAR, Montevideo,

77 Si d: = 0 entonces d:' = -V - dt '. De esta última relación y de las expresiones para d d d d:'y dt'se obtiene g(:,t;v) = /(:,t;v) Entonces poniendo a(v) = g(:,t;v) dt d: d: resulta: dt ' = a(v)- d: + Y?)- dt d:' = y(v)-(d: - V - dt) d: De estas ecuaciones deducimos que entre la velocidad w = de un movimiento de un dt d: corpúsculo respecto de K y la velocidad w' = - del movimiento de ese mismo dt corpúsculo respecto de K' se verifica la relación: Reordenado: a(v) - w' - w + y(v) - (w ' - w) = -y(v) - V Si a(v) = 0 resulta la ley de adición de velocidades de Galileo: Si a(v) ^ 0 w ' = w = w 0 que verifica: w ' = Y(V )- (w - V) (a(v)- w + Y(V )) w ' = w - V existe una velocidad invariante al cambiar de marco de referencia a(v) - w 0 2 = -Y(V) - V r V ^ Entonces: d:' = Y(V)- (d: - V - dt) dt' = y(v)- - d: + dt v w 0 y De donde obtenemos: d: = V 2 A (d:' + V - dt') Y(V )- w 0 y Del principio de relatividad de Poincaré se desprenden las relaciones de reciprocidad: A V d: = Y(- V)-(d:' + V - dt') dt = Y(- V ) d: + dt V w 0 De la isotropía del espacio: y(- V)=Y(V) Comparando las expresiones para d:y teniendo en cuenta que y(v) debe ser positivo, resulta finalmente: y(v) = 1 - V2 Del principio de relatividad se deduce que la velocidad w 0 es la misma para todo marco inercial: es una constante de estructura del espacio-tiempo. Además, la fórmula que expresa y(v) en función de w 0 sugiere que esa velocidad invariante es al mismo tiempo una velocidad límite para todo movimiento de un cuerpo respecto de un marco inercial. Suponiendo que los orígenes de coordenadas coinciden en t = t' = 0 e integrando resultan las fórmulas de transformación de Lorentz: 1 : = 1 V 2 -(: - V -1) t' = 1 V A -: +1 V 2 w y 77

78 7. La interrelación entre el tiempo y el espacio: el continuo de tetra-dimensional de Minkowski y la causalidad en la teoría restringida de la relatividad "Por lo tanto el espacio por sí mismo, y el tiempo por sí mismo, están condenados a desvanecerse en meras sombras, y solamente una especie de unión de los dos preservará una realidad independiente. " Hermann Minkowski durante una conferencia en 1908, en la Universidad de Gottingen, en la que introdujo el concepto de tiempo-espacio y con ello facilitó recorrer el difícil y tortuoso camino que Einstein, Grossmann y Hilbert emprendieron en busca de una generalización de la teoría restringida de la relatividad capaz de abarcar los fenómenos gravitatorios. Cada evento E viene caracterizado, respecto de un marco inercial K, por una cuaterna de números reales (t, x, y, z) que corresponden a la coordenada temporal y a las tres coordenadas espaciales. Esto se puede representar así: (E)> = (t,x,y,z) El mismo evento se puede describir respecto de cualquier marco inercial de referencia. Respecto de otro marco K', un mismo evento E posee otra representación: (E )> =(t', x', y', z') En la teoría restringida de la relatividad, las coordenadas de espacio y tiempo que representan a un mismo evento respecto de dos marcos inerciales se interrelacionan a través de las fórmulas de Lorentz. En 6.1 dichas transformaciones y algunas de sus consecuencias fueron analizadas para el caso particular en el cual el eje x' del marco K' se mueve paralelamente al eje x del marco K, coincidiendo los orígenes de los sistemas de coordenadas espaciales en t=t'=0. Las fórmulas de transformación del instante y de las coordenadas de un mismo evento al cambiar el marco de referencia pueden generalizarse para el caso en que el movimiento relativo de K' respecto de K no se produce necesariamente con los ejes x y x' paralelos entre sí. Supongamos que V es la velocidad de K' respecto de K. Cualquier vector de posición - ( - - * V) - r se puede descomponer en la suma de un vector ^ V paralelo a V y un vector ( - * F) r ^ V perpendicular a V. Aquí representa el producto escalar de vectores y V es la magnitud de V. ( - V) - Al pasar al otro marco de referencia la componente r ^ V permanece invariante, V 2 mientras que el instante y la componente (r * V) j - se transforman de acuerdo con las fórmulas de Lorentz. Entonces si (E)> = (t, r) es la representación del evento E en el marco K, le representación de ese mismo evento en el marco K', es decir (E)> = (t',r') se conecta con (E)> = (t, r) por las expresiones: 78

79 t =- 1 - V2 t- (r V)' r = r- (r V 7 ) -V + - V V 2 ( (r V 7 ) - ^ L-V -1-V V 2 Si se define Y~-, la fórmula para transformar el vector de posición y el instante V 2 de tiempo se pueden re-escribir así: p' = 7 + (y- 1)- (r ^? ) - V - Y - t - V \é j v 2 ' t = Y- fc V )' Parece natural pensar el mundo físico, considerado como un universo de eventos E, recurriendo a un espacio abstracto de cuatro dimensiones. En 1907 Hermann Minkowski desarrolló esta idea introduciendo un continuo tiempoespacio con una definición de distancia entre dos eventos cualesquiera que se calcula a partir de las coordenadas de espacio y tiempo de los eventos y permanece invariante al cambiar de marco de referencia inercial. La denominó intervalo entre eventos. Si At es la separación en el tiempo, y A: Ay Az son las separaciones espaciales a lo largo de los ejes de un sistema de coordenadas cartesianas ortogonales, para un par de eventos que se describen respecto de un sistema inercial >, el intervalo As entre esos eventos se puede definir así: 67 (As) 2 = c 2 (At) 2 - (A:) 2 - (Ay) 2 - (Az) 2 Respecto de un marco de referencia K', el intervalo entre esos mismos eventos se escribe: (As') 2 = c 2 (At') 2 - (A:') 2 - (Ay') 2 - (Az') 2 En forma más compacta, utilizando los correspondientes vectores de posición en el espacio físico se tiene: (As) 2 = c 2 (At) 2 - Ar 7 Ar 7 (As') 2 = c 2 (At') 2 - A p ' A p ' A partir de las fórmulas de transformación de Lorentz se obtiene que (As') 2 = (As) 2. El intervalo, esta medida de la distancia entre eventos, en tanto no depende del marco de referencia inercial respecto del cual se la calcula, es un verdadero absoluto. Como el intervalo entre dos eventos conectados por la trayectoria de una señal luminosa vale siempre cero, el intervalo no corresponde a una métrica propiamente dicha 68, es una pseudo-métrica. Este punto de vista prioriza la representación del mundo físico mediante un espacio abstracto cuyos puntos corresponden a los eventos. El movimiento de una partícula material se representa mediante una curva continua de eventos en el espacio de Minkowski, llamada línea de universo. Desde el punto de vista físico la descripción debe hacerse utilizando algún sistema de coordenadas témporo-espaciales. El mismo evento se puede describir respecto de cualquiera de estos sistemas de 67 Como siempre c es la velocidad de la luz en el vacío. 68 Generalmente se pide que una verdadera distancia entre puntos de un espacio abstracto se anule siempre y cuando los puntos coincidan, pero en el caso del intervalo su anulación no asegura la identidad de los sucesos. Por eso se considera una pseudo-métrica. 79

80 coordenadas, pero hay que utilizar alguno. Cada sistema de coordenadas representa un marco de referencia inercial con sus relojes sincronizados y sus reglas para medir distancias. 7.1 El grupo de transformaciones de Lorentz y la geometría de Minkowski Para cada punto E del espacio de Minkowski, o sea, para la representación matemática de cada evento en el mundo físico, las fórmulas de transformación de Lorentz conectan la cuaterna de coordenadas (t,x,y,z) del evento respecto de un sistema de coordenadas K con la cuaterna de coordenadas (t',x',y',z') de ese mismo evento respecto de otro sistema de coordenadas K\ Consideremos ahora tres sistemas de coordenadask 1, K 2 y K 3 en el espacio de Minkowski. Representamos por L j i la transformación de Lorentz que transforma las coordenadas de tiempo-espacio(e) k = (t i,x i,y i,z i )de sistema K i en sus coordenadas de tiempo-espacio (E) k. =(t J,x J,y J,z J ) sistema. cada evento E respecto del respecto del Entonces se puede escribir la transformación entre sistemas de coordenadas, para cada evento E, así: (E) k = L ; i (E) k En p articular * (E) K 2 = L 2, 1 (E) K 1 (E) K 3 = L 3,2 (E) K 2 (E) K 3 = L 3, 1 (E) K 1 La aplicación sucesiva de L 2 1 y L 3 2 se puede escribir L 3 2 (L 2 1 (E) K1 ) y se comprueba que el resultado, válido para todo evento del espacio de Minkowski, es la cuaterna de tiempo-espacio (E)> del evento E respecto del sistemak 3. Entonces resulta natural definir una operación de composición L 3 2 o L 2 1 entre transformaciones de Lorentz tal q ue L 3,2 o L 2, 1 = L 3, 1. Cada transformación de Lorentz L,posee una transformación inversa L, -1 = L tal J,' A J,' que si I representa la transformación identidad (que deja las coordenadas de cada evento incambiadas), entonces L,, o L,.,. = L,.,. -1 o L,.,. = I t, J J,* J,t J,t Además, la composición de transformaciones de Lorentz es asociativa: L #, 3 0 (L 3,2 0 L 2, 1 ) = (L 4, 3 0 L 3,2 ) 0 L 2, 1 Entonces las transformaciones de Lorentz junto con la operación de composición (aplicación sucesiva) de las mismas, forma lo que en álgebra abstracta se conoce como 69 grupo. Como la transformación resultante de esa operación en general depende del orden en 69 Un grupo G es un conjunto entre cuyos elementos a, b, c,... se ha definido una operación binaria * asociativa (es decir a *(b * c) = (a * b)* c para toda terna de elementos de G), con elemento neutro (identidad) e (es decir tal que e * a = a * e = a para todo elemento a de G) y cada elemento a posee elemento simétrico (inverso) a' (es decir a * a' = a' * a = e). 80

81 que se aplican las transformaciones que se componen, la operación no es conmutativa: se dice que el grupo así definido es un grupo no conmutativo. Solo conmutan las transformaciones de Lorentz cuando las velocidades relativas de los marcos de referencia son paralelas. La teoría de la relatividad puede contemplarse desde dos puntos de vista. En uno de ellos la atención se centra en la relatividad de conceptos como el tiempo y el espacio, que en la física newtoniana se consideraban absolutos. En el otro la atención se vuelve hacia los nuevos absolutos, invariantes bajo el grupo de transformaciones de Lorentz, de los cuales el más básico pero, como se verá en el próximo capítulo, no el único, es el intervalo. Este segundo punto de vista, la del estudio de propiedades de figuras (conjuntos de eventos) que permanecen invariantes bajo un grupo de transformaciones, corresponde al concepto de geometría generalizado por Félix Klein en su famoso Programa de Erlangen. El análisis de la geometría del continuo tiempo-espacio utilizando las coordenadas de los eventos respecto de marcos de referencia es una extensión muy eficiente del método analítico de Descartes. Pero, como señala Synge en su exhaustivo tratado de teoría 70 restringida de la relatividad, el enfoque analítico a veces parece ocultar los objetos geométricos. " Acaso no podemos tratar directamente con esos objetos, como Euclides lo hizo con los puntos, líneas y círculos? Esto es de hecho lo que hizo Robb...Pero la verdad es que estos "métodos sintéticos" son demasiado difíciles." Por este motivo lo que podría denominarse la geometría sintética de Minkowski ha sido escasamente investigada. 7.2 La relatividad del espacio físico y sus consecuencias. Líneas y tubos de universo. Una consecuencia de esta interrelación entre el tiempo y el espacio característica del continuo de Minkowski es que la separación de espacio y tiempo, y el orden temporal en el que se presentan algunos eventos dependen del sistema de referencia respecto del cual se establece el orden temporal y espacial de los fenómenos. En principio, sucesos que son simultáneos respecto de un sistema, no tienen porqué serlo respecto de otro sistema. No obstante, el ordenamiento temporal de sucesos relacionados mediante una influencia física directa (por ejemplo, dos sucesos vinculados mediante la propagación de una señal) es absoluto, el mismo para todos los sistemas de referencia, de modo que un evento que se puede considerar como causa siempre precede a un evento que se puede considerar como su efecto. El cuadrado del intervalo entre dos eventos que pueden tener una relación causal es siempre positivo o nulo, porque siendo la velocidad de la luz la máxima velocidad con que pueden viajar las señales, la distancia espacial entre dos eventos causalmente relacionados debe ser inferior o a lo sumo igual a la distancia que viaja la luz durante el 70 J. L. Synge "Ee/at/v/ty: t&e spec/'a/ taeory", North-Holland, Amsterdam, 2 a edición, 1965, p

82 intervalo de tiempo que separa los eventos, todo ello respecto de un mismo sistema inercial de referencia. Pero los sucesos que no pueden estar relacionados mediante una influencia física directa de uno sobre el otro, presentan un orden temporal dependiente del sistema de referencia respecto del cual son observados. En este caso el cuadrado del intervalo entre los sucesos es siempre negativo (el intervalo es un número imaginario) porque la distancia espacial que separa los eventos es mayor que la distancia que viaja la luz durante el intervalo de tiempo que los separa. Puesto que el orden espacial en su forma pura se refiere a sucesos simultáneos en lugares diferentes y puesto que la simultaneidad de eventos que no ocurren en exactamente el mismo lugar es relativa, resulta que la separación de las relaciones puramente espaciales a partir del conjunto de relaciones de tiempo-espacio es también relativa, dependiente del sistema inercial utilizado para realizar esa separación. El espacio en cuanto tal es una sección del continuo tetra-dimensional tiempo-espacio, sección en la que se encuentran todos los eventos que son simultáneos respecto de un sistema de referencia dado. Pero si cambiamos de sistema de referencia cambian los eventos integrantes de esa sección, porque son otros los eventos simultáneos. Para visualizar esto con facilidad, y puesto que no podemos formarnos imágenes visuales de figuras en cuatro dimensiones, no restringiremos a procesos que se producen en una dimensión espacial. Así podemos representar los eventos en un plano tiempoespacio, como muestra la Figura 1. Cada punto del plano representa un evento posible. Figura 7.1: Relatividad de la simultaneidad de dos eventos AyB respecto del marco de referencia Comencemos con un marco K. Representemos con c t la coordenada temporal y con x la coordenada espacial. En forma arbitraria introduzcamos un par de ejes 71 Al multiplicar por la velocidad de la luz se obtiene una medida del tiempo con dimensiones de espacio

83 cartesianos ortogonales con el espacio en el eje de abscisas y el tiempo en ordenadas, como se ve en la figura. Ahora introduzcamos un nuevo marco K' cuyo eje x se desplaza con velocidad positiva? a lo largo del eje x de K.? 1 Definiendo = y Y = las fórmulas de transformación de Lorentz se c - pueden re-escribir así: x' = y\x-.c t) c t ' = y-(c t- -x) El eje x corresponde a c t' = 0, es decir a la recta c t = -x respecto de los ejes cartesianos ortogonales. El eje c t' corresponde a x' = 0, o sea a la recta c t = x 5 respecto de los ejes del marco K. Como consecuencia los ejes de coordenadas temporal y espacial del marco K' forman un ángulo agudo entre sí, y quedan situados en el primer cuadrante de K como muestra la figura. Finalmente, para un tercer marco K'' que se mueve en sentido opuesto a K', es decir? con = < 0, los correspondientes forman un ángulo obtuso y se disponen como c muestra la figura. Como los ejes de coordenadas de los marcos K' y K'' son oblicuos, las coordenadas de un evento respecto de esos marcos se obtienen por desplazamiento paralelo a uno de los ejes, hasta cortar el otro, y no por proyección ortogonal como en el caso del marco K. En la Figura 1 se marcaron dos eventos, el A situado en el origen común de coordenadas, y el B que es simultáneo con A respecto de K, posterior a A respecto de K' y previo a A respecto de K''. (Estas relaciones se indican mediante flechas que llegan a B desde, o parten de B hacia, el eje formado por los eventos simultáneos a A en los marcos K' y K'' respectivamente).?? Cuando? es positiva, como 0< = < 1, a medida que = crece el ángulo c c entre el eje c t' y el eje x tiende a cero, hasta que en el límite, cuando? se aproxima por debajo a c, ambos ejes se superponen con la bisectriz del primer cuadrante del plano de eventos referido al marco K. Esta observación resulta de importancia en relación con el cono de luz y las conexiones causales en teoría restringida de la relatividad como se verá posteriormente. En suma, si una sección espacial del continuo tiempo-espacio es el conjunto de eventos simultáneos con un evento dado respecto de un marco de referencia determinado, la Figura 1 muestra que esta sección espacial es diferente para marcos diferentes (consiste en los eventos ubicados sobre los ejes de coordenadas espaciales y sus rectas paralelas). Por ser el espacio físico una sección del continuo tiempo-espacio asociada al mismo instante respecto de un marco de referencia, no hay tiempo cósmico ni espacio cósmico que puedan considerarse con independencia de un marco: cambian al cambiar el marco. Por tanto, de acuerdo con la teoría restringida de la relatividad, no es posible pensar en el estado del Universo en un instante de tiempo, como pensaban los astrónomos y cosmólogos presuponiendo un tiempo absoluto separado de un espacio absoluto, antes 83

84 72 de la aparición de la física relativista. Si un cuerpo se mueve respecto de otro cuerpo, no es posible hablar de la distancia entre ambos cuerpos en un instante de tiempo dado sin especificar un marco de referencia. Como consecuencia el enunciado de la ley de gravitación de Newton es ambiguo y no resulta aceptable desde la perspectiva de la física relativista, puesto que involucra una distancia entre cuerpos que se supone independiente del marco de referencia. En la geometría física también aparecen problemas. Por ejemplo, una línea recta en el espacio físico es una cierta traza cuyas partes componentes se manifiestan en forma simultánea para un observador (o una placa fotográfica). Pero como la simultaneidad es relativa, respecto de otro observador esas mismas partes podrán no aparecer ya como simultáneas, así que para este nuevo observador no será una línea recta. A cada sistema material con un volumen finito le corresponde un tubo de universo incluido en el tiempo-espacio de Minkowski: una figura geométrica en dicho espacio tetra-dimensional. Si se trata de una partícula, le corresponde una curva en el tiempoespacio denominada línea de universo. Respecto de un marco de referencia K, el tubo de universo de un sistema material puede seccionarse mediante hiper-planos t=constante y surgen así regiones espaciales tridimensionales cuyos puntos corresponden a eventos simultáneos respecto de K: el volumen que ocupa cada una de ellas es el volumen del sistema en ese instante de tiempo referido a K. De esta forma un observador en reposo respecto de K define el volumen que ocupa el sistema en un instante de tiempo y describe sus variaciones temporales. Pero si utilizamos otros marcos inerciales K', K",..., seccionamos el tiempo-espacio por los hiper-planos t'=constante, t''=constante,..., con lo cual las regiones espaciales tridimensionales ocupadas por eventos pertenecientes al cuerpo estudiado están formadas por eventos diferentes y los volúmenes del sistema son ahora los volúmenes de estas regiones. Entonces un observador en reposo respecto de uno de estos marcos, digamos respecto de K', determina el volumen de ese sistema, en lo que para él es un mismo instante de tiempo, involucrando un conjunto de eventos diferente al involucrado cuando el observador en K realiza su medición. Como consecuencia esos conjuntos de eventos, los referidos a K y los referidos a K', no se relacionan entre sí mediante transformaciones de Lorentz. 73 Fermi se había dado cuenta y había analizado el problema ya en 1923, durante un cálculo de la masa electromagnética mediante un modelo relativista de un electrón considerado como una carga eléctrica distribuida en una región cuya dimensión característica es el radio clásico atribuido a esa partícula y visto en No obstante, como se verá posteriormente, al estudiar el problema cosmológico, el postulado de Weyl introduce una clase de observadores privilegiados cada uno de cuyos tiempos propios se pueden correlacionar con los tiempos propios de los de los demás observadores de tal forma que se puede introducir un tiempo cósmico universal. 73 A. Gamba "Physical quantities in different reference systems according to relativity", American Journal of Physics, Vol. 35, 1967, pp

85 7.3 El tiempo en la teoría restringida de la relatividad Se ha dicho, y se dice a veces, que la teoría de la relatividad espacializa el tiempo. Este punto de vista ha sido sostenido casi siempre por personas inclinadas a pensar que el tiempo es en última instancia una ilusión. La posibilidad de concebir el continuo de Minkowski como algo real y dado en su totalidad, que puede ser visto de afuera abarcando desde el pasado más remoto hasta el futuro más lejano, para todo marco de referencia posible, resulta atractiva para personas que piensan en un universo material causalmente cerrado y estrictamente determinista. En la medida en que la teoría de la relatividad nos conduce a considerar el conjunto de todos los sucesos, haciendo abstracción de sus propiedades concretas, atendiendo solo a la estructura universal de relaciones de acción causal entre ellos, por la cual todo suceso del conjunto actúa, de una u otra manera, sobre otros sucesos y recibe a su vez la acción de los otros, ese mundo de eventos que de ese proceso de abstracción resulta presenta tiempo y espacio fundidos en un continuo. Al intentar caracterizar un evento, es necesario considerar un sistema de coordenadas en ese continuo. Cada sistema de coordenadas admisible para la teoría restringida de la relatividad corresponde a un sistema inercial con sus relojes y sus reglas. La geometría correspondiente a ese continuo se puede caracterizar por las configuraciones que permanecen invariantes bajo el grupo de todas las transformaciones entre esos sistemas de coordenadas (que no son otras que las transformaciones de Lorentz). La pseudo-métrica que se introduce a través del intervalo que separa dos eventos, conlleva la multiplicación del intervalo temporal por la velocidad de la luz, lo cual equivale a sustituir la distancia en el tiempo por una distancia espacial equivalente (la distancia que recorrería una señal luminosa durante ese tiempo), de modo que las cuatro coordenadas de cada evento son espaciales. Claro está que se podría haber dividido las coordenadas espaciales por la velocidad de la luz, y entonces, como las nuevas coordenadas miden el tiempo que una señal luminosa tardaría en recorrer los correspondientes intervalos espaciales, ahora las cuatro coordenadas de un evento serían temporales. Ambas descripciones son equivalentes, así que optar por una u otra es un asunto de gusto o más bien de predisposición. En la descripción en términos de coordenadas temporales el invariante que mide la distancia entre los eventos es la diferencia de tiempo propio entre ellos. La extensión T 2 -T 1 del intervalo de tiempo propio que mide un observador fijo a un marco inercial que se mueve con velocidad? respecto de otro marco inercial se vincula con la extensión t 2 - t x del intervalo de tiempo correspondiente medido por el otro observador por la fórmula: T 2 - T 1 1 -?T (t 2-11) c2 Consideremos ahora una partícula en movimiento, que desde el punto de vista geométrico recorre su línea de universo en el tiempo-espacio de Minkowski. Para caracterizar el movimiento es necesario referirlo a un marco inercial K. Supongamos que la partícula se mueve con velocidad variable respecto de un observador fijo en K. 85

86 Si la trayectoria de una partícula respecto de un marco K viene dada por x = x(t) y = y(t) z = z(t) entonces el intervalo (As) 2 = c 2 (At) 2 - (Ax) 2 - (Ay) 2 - (Az) 2 entre dos eventos sobre que corresponden al paso de la partícula por dos puntos sucesivos de su trayectoria puede re-escribirse como un elemento diferencial sobre esa trayectoria:!(t ) ds i 2 - ( ^ )2 - ( Él )2 - ( dz )2. dt = c 1 2 dt = c dt(t) c2 V dt dt dt v En estas igualdades v(t) = J( d J t) ) 2 + ( ) 2 + ( ^ es la magnitud de la velocidad (en general variable) de la partícula respecto de K. Consideremos ahora su integral sobre la trayectoria de la partícula entre dos instantes t 1 y 1 2 registrados en un reloj sincronizado en K: T 2 l 2 T = í 1 - vm c2 j, De esta última ecuación, teniendo en cuenta que V 1 - V r es menor que 1 cuando c 2 v(to, se deduce que el intervalo de tiempo T 2 -T 1 es siempre más corto que el correspondiente intervalo de tiempo registrado en un marco de referencia inercial respecto del cual se describe el movimiento de la partícula. Qué significado posee T 2 -T 1? Generalmente se supone que T 2 -T 1 es la extensión de un intervalo de tiempo propio, es decir, el tiempo tal como sería medido por un reloj fijo a la partícula. Se admite entonces que la fórmula dr(t): V!2 (t),., 1 dt se puede utilizar c para relacionar el tiempo medido por un observador acelerado con el tiempo medido por un observador fijo a un marco de referencia inercial. No obstante, cuando la partícula se encuentra acelerada respecto del marco inercial K, un marco de referencia N solidario con ella no es ya un marco inercial. Entonces no hay forma de conectarlo con K mediante una única transformación de Lorentz. En la teoría restringida de la relatividad, un observador fijo a un marco inercial puede describir en términos de tiempo y espacio un movimiento cualquiera de un cuerpo o sistema de cuerpos, incluyendo por tanto el movimiento de un observador no inercial. Pero este último no puede hacer una descripción equivalente a la del observador inercial, a menos que abandonemos el marco conceptual propio de la relatividad restringida y pasemos al de la teoría generalizada. Como consecuencia la interpretación de dt(t ) = 1 _ rw 2 dt como elemento de c2 tiempo propio debería ser considerada como un nuevo postulado de la teoría restringida. Sus límites de aplicabilidad deberían discutirse y establecerse en la teoría generalizada, 74 pero no se puede descartar a priori una limitación en las aceleraciones permisibles. 74 H. Schwarz "Introduction to special relativity" Mc Graw-Hill, New York, 1968, p

87 7.4 Causalidad y determinismo en el marco de la teoría de relatividad En el proceso de integración de tiempo y espacio en un mismo continuo de cuatro dimensiones, el espacio parece llevar la peor parte, al menos si se toma como punto de comparación el concepto newtoniano absoluto. Como lo señaló Karl Popper 75, en la teoría restringida de la relatividad, pese a la relatividad de la simultaneidad, (que tanto afecta al concepto de espacio en cuanto tal), lo esencial del concepto de tiempo, el antes y después, su relación con la causalidad, con la asimetría entre el pasado y el futuro, reaparece abriendo nuevas posibilidades epistemológicas. La diferencia de signo que presenta la componente temporal respecto de las componentes espaciales del intervalo, corresponde a una asimetría en los roles del tiempo y el espacio. Mientras que se puede ir de derecha a izquierda y de izquierda a derecha a lo largo de un eje de coordenadas espaciales, en el continuo tiempo-espacio de la teoría restringida de la relatividad se puede influir físicamente sobre eventos futuros pero no sobre sucesos pasados. TIEMPO Figura 7.2 El cono de luz según Arthur Eddington Arthur Eddington 76 propuso representar geométricamente las relaciones entre tiempo y espacio mediante un diagrama que se hizo famoso: la representación de los conos de luz. Limitó las dimensiones del espacio a dos, de modo que añadiendo una dimensión correspondiente al tiempo, se puede hacer el conocido dibujo en perspectiva que aparece en la mayor parte de las obras didácticas y se muestra en la Figura 2. En lo que sigue se efectúa una descripción verbal abstracta de esos conos. Tomando un evento A (aquí-ahora) como origen y un sistema inercial como base para determinar ' En "E7 Dn/verso Alerto: Dn argmrnento a/avor de/ /ndeterm/n/smo", Tecnos, Madrid, 1996, pp ' En "2&e 'atwre Cambridge, UK,

88 las coordenadas de tiempo y espacio, la totalidad de los puntos (eventos) del continuo de Minkowski se reparten en tres regiones, separadas entre sí por la superficie de los denominados conos de luz pasado y futuro: c 2 t 2 - x 2 - y 2 - z 2 = 0 El eje de coordenadas de tiempo es el eje común a ambos conos, que tienen en el evento tomado como origen su vértice común. La magnitud As 2 toma valores positivos en el interior de los conos, negativos en el interior de la región del tiempo espacio que rodea a los conos y cero en la superficie de los mismos. Los eventos tales como B, que se encuentran en el interior del cono superior en la Figura 2, se encuentran siempre en el futuro respecto de A (de ahí la designación de cono de futuro absoluto), mientras que los eventos en el interior del cono inferior se encuentran siempre en el pasado respecto de A (de ahí la designación de cono pasado absoluto). La región que rodea a los conos se puede denominar presente posible (visto desde la perspectiva del tiempo, porque cualquier evento allí situado, tal como el C, puede hacerse simultáneo con el origen si se elige adecuadamente el sistema de referencia) o más allá absoluto (visto desde la perspectiva del espacio, porque no es posible encontrar un sistema de referencia en el que uno de estos eventos se produzca en la misma posición espacial que el origen). La dirección de la línea de universo de una partícula con masa de reposo no nula, se encuentra en cada uno de sus puntos en el interior del cono de luz correspondiente al punto. La dirección de la línea de universo de los corpúsculos con masa de reposo nula, como los fotones, se encuentra en cada uno de sus puntos en la superficie del correspondiente cono de luz. Si la velocidad de la luz se hace tender a infinito, el cono futuro se amplía hasta abarcar el hemi-espacio t > 0, mientras que el cono pasado se amplía hasta abarcar el hemiespacio t < 0. El hiperplano t = 0 que los separa, representa ahora el presente posible, el mismo para todos los sistemas de referencia inerciales: es el presente absoluto de la física newtoniana, formado por eventos que son simultáneos para cualquier observador. A partir de los conos de luz y su significado causal, es posible concluir que la versión de Laplace del determinismo científico no resulta sustentable desde la perspectiva de la teoría restringida de la relatividad. Supongamos que la predicción de los estados futuros de un sistema aislado se efectúa a partir de toda la información que en principio podríajuntar un observador situado aquí y ahora. Ese observador conoce las leyes deterministas de la dinámica y dispone de los medios de cálculo necesarios. Llamemos O al evento asociado con el observador. Sea F un evento futuro que nuestro observador pretende predecir. Por ser un evento futuro se encuentra en el cono futuro de O. Si un evento, tal como F, es posterior a otro, tal como O, es decir si F se encuentra en el cono futuro de O, que entonces le es previo, el cono pasado de F abarca completamente el cono pasado de O. Pero el cono pasado del evento posterior F comprende eventos adicionales respecto al cono pasado del evento previo O, de 88

89 modo que hay sucesos que pertenecen al cono pasado de F pero no pertenecen al cono pasado de O. Como estos eventos pueden influir sobre el suceso que va a ocurrir en F, pero O no puede recibir información sobre ellos porque no se encuentran en el cono pasado de O, el observador no dispone de suficiente información como para poder predecir lo que va a ocurrir en F. Parecería entonces que la teoría restringida de la relatividad conduce a considerar nuestro pasado como aquella región del continuo tiempo-espacio que nosotros, aquí y ahora, podemos en principio conocer, mientras que nuestro futuro es aquella región que, sometida a la influencia del pasado, está siempre abierta y en principio no es plenamente cognoscible. Lo que la teoría restringida permite son retrodicciones completas, no predicciones completas. Eso a pesar de que sus leyes dinámicas son deterministas. En todo esto presuponemos que el observador que predice o retrodice se encuentra en el interior del sistema. Las leyes disponibles son deterministas en el sentido que si se las alimenta de información completa y exacta sobre las condiciones iniciales de un sistema aislado, permiten predecir o retrodecir los estados del sistema con exactitud. El retardo en la recolección de la información proveniente de los puntos distantes genera en última instancia esta asimetría entre pasado y futuro. Si se pudiera recolectar información sin retardo alguno desde cualquier punto del espacio, como presupone la formulación de Laplace sobre la posibilidad de predecir con absoluta precisión los estados futuros de un sistema aislado (el universo en su caso), se podría definir un tiempo absoluto. Entonces, como dijimos antes, los conos de luz degenerarían en semi-espacios separados por un hiper-plano de presente absoluto. Conociendo los sucesos simultáneos en ese presente absoluto (el estado presente del sistema) y las leyes dinámicas deterministas, se podrían predecir los estados futuros o reconstruir los estados pasados con absoluta precisión. Una vez aceptada la teoría restringida de la relatividad, esta posibilidad quedó vedada. 89

90 8. Física relativista "De todo lo expuesto se deduce que el principio de relatividad es equivalente a la afirmación de que las leyes de la naturaleza tienen que verificarse cuando las variables de espacio y tiempo sufren una transformación de Lorentz. Por ello se dice que ellas son relativistamente invariantes. La Física debe presentar claramente sus leyes en formas que posean tales invariancias; cualquier principio o enunciado que falle a este respecto no puede ser una ley general. " W. Mc Crea, "Física relativista", UTHEA, México, Durante los siglos XVII y XVIII se fue consolidando, en torno a la mecánica newtoniana, la idea de una única estructura matemática subyacente a los fenómenos del mundo físico. Se pensaba en esa época, e inclusive todavía lo pensaban muchas personas durante los siglos XIX y XX, que esa estructura es accesible al entendimiento humano y se expresa en las fórmulas matemáticas que los científicos irían descubriendo en forma progresiva y acumulativa. La aparición y posterior desarrollo de la física relativista originó la aparición de ramas de la física paralelas a bien desarrolladas ramas de la física clásica, como la dinámica de partículas, la mecánica de medios continuos, la óptica física e inclusive la termodinámica. No obstante las nuevas disciplinas contenían ciertos resultados incompatibles con algunos de los contenidos de las correspondientes ramas clásicas de la física, excepto en un caso: cuando las velocidades en juego eran pequeñas respecto de la velocidad de la luz. Si esto ocurría, las nuevas fórmulas se reducían siempre a las antiguas. Pero, como se desprende de los conceptos relativistas de tiempo y espacio estudiados en el capítulo 7, el tiempo que aparece como parámetro en la dinámica de Newton no es compatible con el tiempo que aparece en las ecuaciones de la física relativista, pese a que estas últimas se reduzcan a las primeras cuando, al tender la velocidad de la luz a infinito, los conos de luz de los eventos se abran hasta abarcar dos semi-espacios completos. Dos décadas después de la aparición y consolidación de la física relativista, se consolidó la física cuántica en los trabajos de Schrodinger, Heisenberg y Dirac, con consecuencias aún más revolucionarias y destructoras para la visión newtoniana del mundo. Por otra parte, las ideas acerca de la naturaleza de la matemática y su relación con el mundo fenoménico se modificaron profundamente durante el siglo XIX y el primer tercio del siglo XX. El ideal de una estructura cerrada con un fundamento definitivo, perseguido por los formalistas encabezados por Hilbert, debió ceder frente a la idea de estructura abierta que se desarrolló a partir de los resultados de Godel y Lakatos. Estos cambios en los conceptos sobre la matemática y la física, condujeron a que la antigua idea de que existe una única estructura matemática profunda, subyacente a la realidad y susceptible de ser descubierta durante un proceso de progreso ininterrumpido, fuera paulatinamente abandonada por la mayoría de los investigadores en favor de la idea de que la estructura matemática de la física teórica consiste en modelos que se construyen para ayudar a comprender el mundo físico: explicar en lo posible las relaciones entre fenómenos ya conocidas y predecir otras nuevas. En la medida en que solo son modelos matemáticos, resulta admisible que puedan presentar ciertas incompatibilidades. 90

91 72 Como señaló Bridgman, luego de la consolidación de las físicas relativista y cuántica, parece poco plausible que nuevas revoluciones científicas modifiquen sustancialmente las ideas sobre el rol del observador en física. Pero debemos reconocer que la lógica, las matemáticas y la física teórica son en buena medida inventos nuestros, y que por ello no es prudente esperar de ellas un éxito rotundo y definitivo. Antes de comenzar a analizar este tema, al final del presente capítulo, revisaremos algunos aspectos de física relativista. Los aspectos seleccionados, además de su importancia intrínseca en el marco de la teoría restringida, son necesarios para un abordaje histórico de la teoría generalizada en los capítulos 10 y 11, y su aplicación a la denominada cosmología científica y a la astrofísica estelar en los capítulos 12 y 13. Parte del contenido de las secciones 8.4 (nociones sobre cuadrivectores y campo electromagnético) y 8.7 (nociones sobre termo-mecánica de fluidos relativista) es un poco más abstracto, y para algunos lectores podría resultar algo más demandante desde el punto de vista matemático, que el resto del capítulo. Pero para continuar con la lectura del libro alcanza con captar las ideas principales allí expuestas. 8.1 Dinámica relativista y leyes de conservación Para satisfacer el principio de relatividad restringida, las ecuaciones de la dinámica deben formularse de tal modo que adquieran la misma forma respecto de cualquier marco inercial: esto se resume diciendo que deben ser covariantes bajo el grupo de transformaciones de Lorentz. En este capítulo seguiremos un orden de exposición parecido al histórico. Por ese motivo, recién en la parte 8.5 consideramos el concepto de cuadrivector asociado al espacio de Minkowski y cómo este concepto permite una formulación matemática precisa del requerimiento de covariancia. Además, la formulación de la dinámica relativista debe satisfacer el principio de consistencia según el cual una nueva teoría (en este caso la mecánica basada en la teoría restringida de la relatividad) que pretende reemplazar a una más antigua (la mecánica de Newton) debe dar cuenta de todas las predicciones exitosas de esta última Dinámica de una partícula Definiendo la cantidad de movimiento o momento lineal p de una partícula como el producto de su masa inercial m por su velocidad v, la segunda ley de Newton se puede escribir de esta forma p = F. dt Como la masa de la partícula se supone constante p = m v = m a, con lo que se dt dt recupera la formulación usual de la segunda ley: m a = F Puesto que en su forma original la segunda ley es invariante bajo transformaciones de Galileo, para poderla extender al caso relativista es necesario formularla de modo que 77 W. Dampier "Historia de la ciencia y sus relaciones con la filosofía y la religión", Tecnos, Madrid, 1997, p

92 resulte invariante bajo las transformaciones de Lorentz. Puesto que las leyes de la electrodinámica clásica son invariantes bajo estas últimas transformaciones, el problema de obtener una formulación relativista para la dinámica se encaró originalmente desde la electrodinámica. No obstante es posible obtener la solución desde una perspectiva puramente mecánica, definiendo la cantidad de movimiento y la energía relativista de modo tal que cumplan las correspondientes leyes de conservación y se reduzcan a sus expresiones clásicas cuando las velocidades de las partículas sean despreciables respecto de c. Si admitimos la cinemática relativista, mantenemos la definición de cantidad de movimiento como producto de masa por velocidad, e imponemos la conservación de la cantidad de movimiento del sistema durante el choque elástico de dos esferas de igual masa (cuando se las mide respecto del mismo marco de referencia), es posible 78 demostrar, siguiendo a Tolman, que la masa que puede denominarse masa relativista debe necesariamente modificarse en función de la velocidad según la ley general: m m = v V Cuando la velocidad de la partícula resulta despreciable respecto de la velocidad de la luz esta fórmula se reduce a m = m 0, siendo m 0 homologable a la masa inercial de la mecánica newtoniana. En física relativista se la conoce como masa en reposo, o simplemente masa y se asume que es invariante bajo las transformaciones de Lorentz 79 Entonces la cantidad de movimiento viene dada por Con la nueva definición de cantidad de movimiento la extensión relativista de la f \ d_ m n d - segunda ley es inmediata: p = F dt dt.v 1 - Pero como en dinámica relativista se postula esta formulación matemática de la ley del movimiento, su validez debe confirmarse confrontando sus consecuencias operacionales con los resultados de experimentos adecuados. La comprobación experimental ha sido realizada empleando fuerzas de origen electromagnético, calculables mediante la fórmula de Lorentz F = q - {E + v x B) cuyas componentes eléctrica y magnética fueron explicadas en la parte 4.1. p m 1-78 R. Tolman "Relativity, thermodynamics and cosmology", Dover, New York, Una deducción simple de la fórmula para la masa relativista se encuentra en el capítulo 3 del libro de R. Resnick "Conceptos de relatividad y física cuántica", Limusa, México, Que la masa en reposo sea un invariante relativista no significa que permanezca inmutable: puede desaparecer parcial o totalmente, como se indica más adelante en esta misma sección. 92

93 Debido a la aparición del factor \ m n v de masa relativista (que varía si varía la magnitud de la velocidad) en lugar del factor de masa newtoniana, en general la fuerza relativista no es paralela a la aceleración, a diferencia de lo que acontece con la fuerza y la aceleración en mecánica newtoniana. Si el movimiento respecto de un marco K se produce a lo largo de una recta, la fuerza es paralela a la aceleración y la fórmula del movimiento se reduce a la expresión escalar: f \ d_ dt m v 1 - v 1 - m 3 dv = F dt Si se define una masa longitudinal m, m 3,2 > 2, resulta que la expresión relativista para la segunda ley adopta una forma análoga a la de la mecánica clásica m, a = F, pero con una masa longitudinal que aumenta al aumentar la velocidad del cuerpo. Cuando el movimiento no es unidimensional, se introduce una masa transversal m 0 m t = = m. v Cuando las relaciones entre la velocidad y estas dos masas relativistas, (masa longitudinal y masa transversal) se comparan con los resultados experimentales como los obtenidos por Kaufmann (1902) y Bucherer (1909), y con las mediciones realizadas en aceleradores de electrones, el acuerdo es excelente. La dinámica relativista de las partículas cargadas en campos electromagnéticos resulta una herramienta fundamental para diseñar aceleradores para uso médico, industrial o en investigación. Si no se tiene en cuenta el aumento relativista de la masa en el diseño del acelerador, éste no funciona. La variación AF en la energía del cuerpo, cuando su velocidad aumenta desde cero en el instante inicial hasta u en el instante t, se puede definir como la integral de la potencia F v: i AF = J F (t ) v(t ) dt = J- L m dv, m 0 c - v dt = 3 dt f v 1 V mi 0 c 2 = m c 2 - m 0 c 2 Así pues la variación de energía se relaciona con un cambio en la masa relativista: AF = c 2 Am Cuando la velocidad de la partícula es despreciable respecto de c, la variación en la energía del cuerpo se reduce a la energía cinética de la mecánica clásica: 93

94 AE 1 m0 v En general AE representa la energía cinética relativista de un cuerpo de masa en reposo m 0. Si la energía total de un cuerpo que se mueve libremente respecto de un marco de referencia es v 1 - y si AE es su energía cinética, entonces m 0 c 2 se puede interpretar como una energía asociada a la masa reposo del cuerpo. Es posible justificar la expresión de la energía para un cuerpo en movimiento libre y su conservación para un sistema de partículas. Cuando v se aproxima por debajo a la velocidad de la luz en el vacío, la energía y la cantidad de movimiento tienden a infinito, al igual que el trabajo que es preciso realizar para acelerar el cuerpo. Esto significa que 1 a velocidad de la luz no es alcanzable por un cuerpo cuya masa en reposo sea diferente de cero. Eliminando la velocidad de la partícula partir de las relaciones E = m 0 c v y P= m 0 v v se obtiene la fórmula siguiente, que relaciona la energía con la cantidad de movimiento: E = ^m2 c# + c 2 p Sistemas de partículas y leyes de conservación Cuando se considera un sistema aislado de partículas que han interactuado entre sí durante un tiempo y luego se mueven libremente, tanto en mecánica clásica como en mecánica relativista se verifican ciertas leyes de conservación en forma independiente del tipo de interacción. Estas leyes de conservación, de considerable interés, no solo físico sino también filosófico, se pueden obtener a partir de las propiedades de homogeneidad del tiempo y de la homogeneidad e isotropía del espacio 9. En ausencia de un campo de fuerzas externo al sistema, o en presencia de un campo de fuerzas estacionario y conservativo, las propiedades del sistema como un todo no cambian con el paso del tiempo debido a que todos los instantes son equivalentes con respecto de ese sistema. Una consecuencia de esto es que la energía total del sistema se mantiene constante durante el movimiento. Por ejemplo, supongamos que un cuerpo libre de masa en reposo m 0 se encuentra 90 La formulación de la mecánica, tanto clásica como relativista, a partir del principio de Hamilton de mínima acción, permite la deducción más clara y directa de las leyes de conservación asociadas a estas simetrías del tiempo y del espacio. Ver por ejemplo, los libros de L. Landau y E. Lifchitz "Mecánica" y "Teoría del campo", Reverté, Barcelona,

95 inmóvil respecto de un marco K y que se fragmenta espontáneamente en dos cuerpos libres de masas en reposo m 1 y m 2. Esos cuerpos poseen velocidades! y v 2 respectivamente, referidos al marco K. La conservación relativista de la energía da para este caso: m, c 2 m c 2 m 0 c = + V $ ü- Como los denominadores son siempre menores que 1, esta igualdad exige que la masa en reposo del cuerpo sea mayor que la suma de las masas en reposo de los fragmentos: m 0 > m x + m 2 En forma equivalente el defecto de masa Am = m 0 - m x - m 2 debe ser positivo. La energía asociada con la masa en reposo Am que desaparece, aparece en forma de energía cinética de los fragmentos. Si estos se frenan al atravesar un material, su energía cinética se transforma en calor, como ocurre con los fragmentos de fisión de un núcleo de uranio o plutonio en el combustible de un reactor nuclear. Si el defecto de masa Am fuera negativo, la fragmentación espontánea no sería posible porque violaría la conservación de la energía. No obstante, se lo podría fragmentar inyectándolo energía desde el exterior, en cantidad por lo menos igual a - Am c 2. La relación entre la masa en reposo y la energía de un cuerpo permite cuantificar la AF pérdida de masa asociada a una pérdida de energía. A partir de = Am, se puede c estimar que el Sol pierde unas 4c 10 toneladas de masa cada segundo. Cuando un electrón se combina con su antipartícula, el positrón, de igual masa en reposo pero carga eléctrica opuesta, la carga desaparece, al igual que las masas, y aparecen fotones que conservan la energía y la cantidad de movimiento de las partículas originales. En esta transformación se basa la tomografía por emisión de positrones (PET). Un fotón en las proximidades de un núcleo atómico puede dar origen a un electrón y su antipartícula. Así pues, en física relativista la masa en reposo no se conserva, a diferencia de lo que se ocurre en física clásica. La masa puede desaparecer o aparecer. Solamente se conserva la energía. Puesto que los experimentos sugieren que la masa inercial es igual a la masa gravitatoria, cuando una parte de la masa inercial desaparece, el peso de la masa remanente es inferior al peso de la masa inicial. Cabe preguntarse si la energía correspondiente a la masa faltante posee peso y si éste es el mismo que corresponde a dicha masa. Los experimentos sugieren que si: la proporcionalidad entre la masa inercial y la masa gravitacional se extiende a la masa relativista de una partícula y en general a toda forma de energía de un sistema de partículas en interacción, a la que pueda asociársele una masa equivalente (por ejemplo, energía potencial). Los primeros 2 81 Se puede hacer un cálculo aproximado de AF estimando la potencia por unidad de área que incide sobre nuestro planeta y suponiendo que la energía radiada se distribuye uniformemente en la superficie de una esfera con el sol en su centro y radio igual a la distancia entre la Tierra y el Sol. 95

96 experimentos se realizaron entre 1910 y 1920, comparando los períodos de dos tipos de péndulo. Se experimentó con péndulos con masas involucrando núcleos atómicos radioactivos y péndulos con masas formadas por átomos cuyos núcleos son estables, sin hallar diferencias en los períodos que pudieran asignarse a diferencias en el peso de la 82 energía. Debido a la homogeneidad del espacio, las propiedades de un sistema aislado de partículas no cambian si el sistema sufre una traslación arbitraria (se mueve paralelamente a sí mismo una distancia cualquiera). Una consecuencia de esto es la conservación de una cantidad vectorial, la cantidad de movimiento total del sistema. Si dos partículas de masas en reposo m 1 y m 2 se aproximan y sufren una colisión, dando origen a dos partículas de masas en reposo m 3 y m 4, la conservación relativista de la cantidad de movimiento se formula así: P + P2 = v1 + m 3 -* 3 v = 3 v + 2 v 4 = P3 + P# V V 1 - Cuando las velocidades de las partículas son pequeñas respecto de c, se reduce a la fórmula de la mecánica newtoniana de la parte 2.2. Las colisiones elásticas entre protones rápidos y protones prácticamente en reposo, observadas en cámaras de niebla, muestran que las velocidades y los ángulos de los dos protones después de la colisión concuerdan con lo que se desprende de las fórmulas relativistas para la conservación de la energía y de la cantidad de movimiento. La isotropía del espacio implica que las propiedades de un sistema aislado de partículas no deben variar cuando se lo someta a una rotación arbitraria en torno a un eje cualquiera. Una consecuencia de esto es la conservación de una cantidad vectorial, el momento de la cantidad de movimiento o momento angular total del sistema, que depende de la velocidad de rotación y de la distribución de masas en torno al eje de giro. Si esta última se contrae hacia el eje, la velocidad angular debe aumentar para mantener constante el momento angular. Este proceso, como se verá en la sección , adquiere importancia durante la formación de una estrella de neutrones Transformación de la fuerza al cambiar de marco inercial. Acción y reacción Consideremos una partícula que en un instante dado se mueve respecto de un marco K, paralelamente al eje x, con velocidad v sometida a una fuerza de componentes F x, F y y F ( respecto de los ejes de coordenadas cartesianas ortogonales. Supongamos que respecto del marco inercial de referencia K' la partícula se mueve con velocidad v' paralelamente al eje x', siendo x y x' paralelos, por acción de una fuerza de componentes F^ F' y F ( respecto de los ejes espaciales de K'. 83 Entonces es posible demostrar que se verifican las siguientes leyes de transformación : 82 W. Mc Crea, "Física relativista", pp , UTHEA, México, W. Mc Crea, "Física relativista", pp , UTHEA, México,

97 F' F F' F 3'= F ^ = y 1 ( = 1 ( X X I 2 2 ' ^ 1 - ^ r c 2 r c 2 r c - r c - Supongamos que respecto de un marco K, en un cierto instante, dos partículas están sometidas a fuerzas iguales u opuestas, pero se mueven con diferente velocidad. Como consecuencia de esta diferencia de velocidad, respecto de otro marco K' estarán sometidas a fuerzas diferentes. Aplicando este resultado a las fuerzas de interacción entre dos partículas resulta que en general acción y reacción no serán iguales: la tercera ley de Newton no puede extenderse a la mecánica relativista. Si se admite que la tercera ley se aplica (al menos como una muy buena aproximación) cuando las velocidades de movimiento respecto de un marco inercial son despreciables en comparación con la velocidad de la luz, entonces la tercera ley debería resultar aplicable en física relativista para un sistema de referencia en el caso límite en el que las dos partículas que interactúan poseen velocidad relativa nula. Otra consecuencia interesante es que si respecto de un marco K la fuerza depende solamente de la posición de la partícula, respecto de otro marco K' la fuerza correspondiente depende en general de la posición y de la velocidad. 8.2 Electrodinámica, relatividad y cuantos Hemos visto que si existe un límite superior finito para la propagación de las perturbaciones, no pueden existir cuerpos rígidos en sentido estricto, ni siquiera como una idealización teórica, puesto que en un cuerpo rígido todos los puntos deben comenzar a moverse en el mismo instante en el que se aplica una fuerza, no importando su distancia al punto de aplicación de la fuerza. Esto tiene a su vez consecuencias sobre el concepto de partícula elemental, entendiendo por tal un cuerpo que participa en todos los movimientos posibles como una entidad, o sea, que carece de sentido hablar de sus partes. Su estado, desde el punto de vista de la cinemática, viene dado por su posición y por su velocidad como un todo. Si una partícula elemental, tal como un electrón, poseyera dimensiones finitas, no podría deformarse sin dejar de ser elemental. Como la teoría de la relatividad elimina los cuerpos rígidos, una partícula elemental debe necesariamente ser considerada en todos los casos estrictamente como un punto geométrico. Es decir, no se trata de la posibilidad de despreciar las dimensiones de un cuerpo material para algunos problemas de movimiento, como ocurre en mecánica newtoniana, sino de la imposibilidad de describir la posición de una partícula elemental sin reducirla a un punto del espacio. En 4.1 vimos que la auto-energía electroestática de una esfera de radio E 0 q 2 uniformemente cargada es. Como un electrón se considera una partícula elemental, entonces para él E 0 = 0, por lo cual debe tener auto energía infinita. Como la masa en reposo se vincula con la energía de reposo 3 0 de un cuerpo a través de la fórmula E m 0 = f, y la energía debería incluir a la auto-energía electroestática, se obtendría un c2 resultado físicamente absurdo: la masa en reposo del electrón debe ser infinita. 97

98 Puesto que la relación entre la masa y la energía se encuentra bien establecida, se concluye que la electrodinámica clásica no es aplicable a las partículas elementales, partículas que desde la perspectiva de la física relativista deben ser consideradas como puntuales. En particular resulta imposible discutir el problema del origen electromagnético de la masa del electrón en el marco de la electrodinámica clásica. Si admitimos que la auto-energía electromagnética de un electrón es del orden de su e 2 energía en reposo E 0 = m 0 c 2, y si introducimos un radio r 0 tal que m 0 c 2 -- obtenemos r 0 ~ - -. m 0 c 2 La distancia r 0 a la cual la auto-energía electroestática de un electrón se hace del mismo orden que la energía asociada con su masa de reposo se puede tomar como estimación de los límites de aplicabilidad de la electrodinámica clásica 84 : r 0 ~ 10-1 $ m Cuando se tienen en cuenta los fenómenos cuánticos se obtiene una estimación de los límites de aplicabilidad de la electrodinámica clásica tres órdenes de magnitud mayor que la que obtuvimos a partir de la auto-energía electroestática, siendo h la constante h de Planck: r ~ ~ m Por tanto parece que es la naturaleza cuántica del micro-mundo, y no la singularidad en la energía electromagnética para las partículas elementales, la que limita la validez de la electrodinámica clásica cuando entran enjuego distancias muy pequeñas. 8.3 Partículas y corpúsculos: fotones, campos gravitatorios y relojes A partir de las fórmulas para la cantidad de movimiento y la energía se desprende esta - E - relación independiente del valor de la masa en reposo: p =! c 2 La cantidad de movimiento de una partícula puede permanecer constante si su masa en reposo tiende a cero y su velocidad se aproxima a la de la luz de forma tal que la masa relativa m = m 0 r permanece constante e igual p. En el límite la cantidad de r 0 i E movimiento es p = p c y la energía E = p c Entonces p =. c Resulta conveniente reservar el término partícula para el caso en que la masa en reposo no es nula, y corpúsculo para abarcar tanto las partículas como los objetos a los que pueda asociarse una masa en reposo nula. Así pues, 1 a dinámica relativista permite la existencia de corpúsculos con masa en reposo nula moviéndose con la velocidad de la luz en el vacío. La teoría cuántica de la luz interpreta los fenómenos luminosos en términos de 84 Si la masa en reposo se interpreta mediante el modelo de Lorentz para un electrón acelerado considerado en 4.3, este parámetro coincide con el radio clásico del electrón introducido por Lorentz. 98

99 corpúsculos de este tipo: los fotones. La energía del fotón viene dada en función de su frecuencia f y de la constante de Planck & por la fórmula: E = & f E & f La masa relativa del fotón u = r =, su masa en reposo es nula y su cantidad de c 2 c & f -, & / movimiento es p = u c = c o bien p = c =. c 2 c Comparando el cociente de frecuencias de un mismo fotón respecto de dos marcos de referencia inerciales, por un lado obtenido (el cociente de frecuencias) de la óptica relativista a partir de los aspectos ondulatorios del fotón, y por el otro lado obtenido a 85 partir de la dinámica relativista, se obtiene el mismo resultado. Como consecuencia, la hipótesis de los fotones (cuantos de luz) resulta compatible con el principio de relatividad de Einstein. Si suponemos que el fotón presenta una masa gravitatoria, que la masa relativa del fotón & f es igual a su masa gravitatoria y que la energía E = & f se debe interpretar como c2 una energía cinética, entonces una aplicación algo ingenua 86 del teorema de la conservación de la energía suministra la siguiente igualdad entre las frecuencias de un mismo fotón cuando pasa por dos puntos PyP' con diferente potencial gravitatorio newtoniano <p(p) y <p{p') : & f (P) + P(P) = & f (P ') + <(P') c 2 c 2 En lo que sigue supondremos que el potencial se debe a una masa respecto a la cual los observadores situados en P y en P' se encuentran en reposo. Si se puede suponer simetría esférica, y si r P es la distancia entre el centro de la masa gravitante y el punto P, / x 5 ; entonces p(p) =. Eliminando la constante de Planck y reordenado se obtiene: /(PO 1 +^ f (P) = 1+i 1+ <(.') c Si el potencial gravitatorio en el punto P' es mayor que el potencial gravitatorio en el punto P, entonces la frecuencia del fotón cuando pasa por P' es menor que su frecuencia cuando pasa por P: un observador situado en P' detecta un corrimiento hacia el rojo respecto de la frecuencia que mide un observador situado en P, o en forma equivalente, en P se detecta un corrimiento hacia el azul respecto de la frecuencia medida en P'. Puesto que como se verá en el próximo capítulo, esta fórmula se puede justificar en el límite de campos débiles, resulta que < debe ser muy pequeño respecto de la c2 unidad. Entonces el corrimiento relativo se puede estimar mediante la fórmula: p(p) 85 Esta comparación fue realizada por Kermack, Mc Crea y Whittaker en Ver W. Mc Crea, "F/«'ca reto/vwta", pp , UTHEA, México, Pero que se puede justificar sobre la base del principio de equivalencia de Einstein. 99

100 /(.')-/(PL (p(p')-p(p)) = 1 G M f(p) - c 2 c 2 f 1 1 > Esta expresión se aplica en astronomía para determinar el radio y la densidad de las estrellas. En la Tierra se mide el corrimiento al rojo de una línea espectral de absorción conocida (línea de Fraunhofer) cuando el correspondiente fotón es emitido y luego absorbido desde la superficie de una estrella (por ejemplo, Sirio, que da un corrimiento relativo de -7 c 10-4 ). / N G M El potencial gravitatorio en la superficie de la estrella (p(p) = se puede estimar R a partir de la ecuación para el corrimiento relativo, suponiendo que el punto P' (situado en la superficie de la Tierra) está tan alejado de la estrella que p(p') ~ 0 y teniendo en cuenta que c = 2,99776 c cm/s. 33 Cuando se conoce el potencial y se puede estimar la masa de la estrella (M = 2c gramos en el caso de Sirio), teniendo en cuenta que G = 6,67 c 10" cm/g c s, se puede calcular el radio R de la estrella (el cálculo da 2 c 10 cm para Sirio). A esa masa y ese radio corresponden la densidad enorme del tipo de estrella conocida 8! como enana blanca, en este caso de una densidad aproximada de 10 gramos/ cm. Un átomo que emite una línea espectral de frecuencia f puede ser considerado como un reloj de período T = 1. Una consecuencia del efecto del campo gravitatorio sobre la frecuencia, y por tanto sobre el período del reloj atómico, es que un observador que examina la marcha de un reloj (es decir, de un átomo de un isótopo de un elemento químico) situado en un punto con menor potencial gravitatorio que el correspondiente al punto donde se halla el observador, constatará que ese reloj atrasa respecto de un reloj formado por un átomo del mismo isótopo, cuando este último está colocadojunto al observador. Cabe esperar el mismo efecto del campo gravitatorio sobre cualquier proceso periódico. 8.4 Invariancia de la fase de una onda La fase de una onda permite caracterizar eventos tales como el desvanecimiento de los campos eléctrico y magnético observados respecto de un marco K en un instante t y en un punto de coordenadas x,y,z. Respecto de un nuevo marco K' ese evento se producirá en un instante t' y en un punto de coordenadas x ', y ', z ', pero el evento en sí mismo, es decir, la anulación de los campos en el caso del ejemplo que consideramos, no habrá cambiado. De lo contrario el marco K respecto del cual los campos se desvanecen se podría distinguir de todos los demás marcos inerciales a partir de la observación de un fenómeno físico, violando entonces el principio de relatividad de Einstein Efecto Doppler y aberración relativista de la luz Consideremos entonces la fase de una onda armónica plana representada respecto del v r. marco K en un punto de coordenadas espaciales x, y, z en el instante t: r. y 100

101 Respecto de otro marco K' la fase verifica: $(f, x, y, z) = x k x + y k y + z k z - a f x k x + y k y + z k z - f = x' k' x + y' ky + z' k' - a' f ' Sustituyendo x', y', z' y t' en función de x, y, z, y t de acuerdo con las fórmulas de transformación de Lorentz, y comparando coeficientes entre el miembro de la izquierda y el miembro de la derecha de la igualdad, se obtienen las fórmulas de transformación para las componentes k x, k y, k z del número de ondas y para la frecuencia angular a k', a'-v deoscilación: kx = k,, = k' k. = k' a= a ' 2 y i 1 - V, 1 - V Se advierte que la componente del vector de ondas paralela a la velocidad relativa de los marcos se transforma como el tiempo y la frecuencia como la coordenada espacial correspondiente Supongamos una fuente de ondas fija en K', de frecuencia a, y admitamos que 6'es el ángulo entre la velocidad relativa y +k: V de K' respecto de K y el segmento de recta que une un receptor fijo a K con la fuente. En ese caso: k' x = kcos6 = aa cos6 Sustituyendo este resultado en la fórmula de transformación para la frecuencia se obtiene: a' i 1 +? cos 0' c a = c V 1 - Si la fuente se mueve hacia el observador, 0 = n y entonces se obtiene una fórmula utilizada para determinar las velocidades radiales de las estrellas: V N a 11 - c a =, v x = a 1 - V c 1 + V c V 2, ( V En el caso no relativista se desprecia - respecto de la unidad y a = a 11 c 2 v c La corrección relativista viene dada por el factor 1 / n Si la velocidad de la fuente es perpendicular al observador, 6 = y en este caso: i 1 - s 101

102 tó = - tó 1 - En el caso no relativista las frecuencias son iguales. En el caso relativista las frecuencias V ya no son iguales. Hay un efecto, pero es de segundo orden respecto de. Este efecto c 87 fue observado por Ives en la radiación proveniente de iones en movimiento rápido V como para que resulte lo suficientemente próximo a 1 como para poder detectar el c desplazamiento de frecuencia por métodos espectroscópicos. Consideremos ahora un rayo de luz emitido en el marco K ' formando un ángulo & con el eje x. Igual que antes, suponemos que el marco K ' se mueve respecto del marco K con velocidad V manteniéndose paralelos los ejes x y x. Entonces el rayo forma un ángulo & también respecto de eje x. La magnitud del número de ondas cambia dependiendo del marco de referencia respecto,,,,,, tó lf tó., tó V i - del cual se lo considere, puesto que 1 = y 1 =, siendo = c c tó,, V, 1 H cos& c De la igualdad 1 = 1' se desprende que 1 send = 1' send', es decir que el ángulo 6 del rayo de luz respecto del eje x va a ser diferente de &: es el fundamento de la corrección relativista al efecto de aberración de la luz ya estudiado en óptica clásica y aplicado en astronomía. Busquemos entonces una relación entre 6 y &. 1' otó Comencemos con send = send' = sen& Teniendo en cuenta la fórmula para 1 t ó introducida más arriba, resulta finalmente: sen& = V c 2 _ sen& tó V, 1 H cosd c Esta última ecuación resulta de importancia al considerar el próximo tema: cómo aparecen cuando son vistos por un ojo o fotografiados por una cámara los objetos en rápido movimiento respecto de la cámara o del ojo. 87 H. Ives y G. Stilwell, "An experimental study of the rate of a moving atomic clock", Journal of the Optical Society of America, 28, 1938, pp

103 8.4.2 La apariencia visual de objetos que se mueven con velocidades cercanas a la de la luz en el vacío Desde los trabajos de Einstein de 1905 hasta los trabajos de James Terrell y Roger Penrose de 1959, la gente pensaba que durante una observación visual un objeto en movimiento se vería contraído en la dirección de su velocidad V por un factor Como consecuencia el efecto solo sería aparente a velocidades lo bastante próximas a la de la luz y en esas condiciones se creía que una esfera parecería un elipsoide achatado en su dirección de movimiento. No obstante, Penrose y Terrell (y este último en particular) demostraron que el efecto del movimiento aparece como una rotación de los cuerpos respecto de su apariencia en reposo 99. Cuando vemos o tomamos una instantánea con una cámara fotográfica los cuantos de luz que llegan en forma simultánea a nuestra retina o a la placa fotográfica, no han sido emitidos simultáneamente desde el objeto: los puntos más alejados del ojo o de la cámara han emitido su parte de la imagen antes de que los puntos más próximos hayan emitido la suya. Como un objeto en movimiento respecto de un observador se encuentra en puntos diferentes en instantes diferentes cuando las distintas partes han emitido la parte de la imagen que les corresponde, esto tiene como consecuencia una imagen distorsionada del 99 objeto que está siendo observado visualmente. 99 Una revisión del problema de la apariencia visual de los cuerpos en movimiento puede verse en V. Weisskopf "Zayis'ca en e/«'g/oxy", Alianza editorial, Madrid, 1990, pp Supongamos que una varilla de longitud L lejana respecto de un observador, se mueve perpendicularmente a su eje longitudinal con velocidad uniforme V y pasa justo por encima del ojo de un observador. Si la velocidad de la luz fuera infinita, el observador vería una imagen de punto o pequeño círculo. Pero como es finita, la luz emitida por un punto del extremo distal de la varilla (alejado del observador) tarda un tiempo en alcanzar el extremo proximal. Dos pulsos de luz, uno proveniente del extremo c distal y otro del proximal de la varilla, que alcanzan simultáneamente el ojo del observador, no fueron emitidos simultáneamente. El que viene del extremo distal fue emitido un tiempo L antes que el otro. c Pero en ese momento la varilla no se encontraba justo encima del observador, sino en un punto situado a una distancia L? de esa posición. Entonces el pulso llega al ojo proveniente de ese otro punto. Lo c mismo ocurre con los demás puntos de la varilla: el pulso proveniente de un punto situado a una distancia x del extremo proximal y que llega al ojo simultáneamente con los demás, fue emitido un tiempo c antes y desde un punto situado a una distancia? Entonces la imagen de la varilla en movimiento no es c 103

104 Lo que Terrell descubrió es que para objetos lo bastante alejados como para que los rayos luminosos que de ellos provienen se puedan considerar paralelos, la contracción de Lorentz-FitzGerald cancela parte de la distorsión de modo tal que los objetos de forma tal que estos últimos no aparecen distorsionados, sino que aparecen rotados. Consideremos un conjunto de pulsos de luz que salen de puntos diferentes de un mismo objeto y viajan paralelos entre sí en dirección a un observador. Supongamos que en el marco K respecto del cual tanto el observador como el objeto están en reposo, los pulsos alcanzan en forma simultánea un plano ortogonal a su dirección de movimiento, que denominaremos plano del observador, y forman allí una imagen del objeto. Si el objeto comienza a moverse con velocidad V respecto del observador, solidario con un marco K', los rayos provenientes del objeto forman un ángulo & respecto del eje x' de K', pero forman un ángulo diferente & respecto de K. La fórmula de la aberración de la luz deducida en la sección conecta estos ángulos entre sí. Según la física pre-relativista, debido a que asume la validez de la ley de adición de velocidades de Galileo, los pulsos que antes llegaban simultáneamente al plano del observador cuando éste y el objeto observado se encontraban en reposo respecto del mismo marco K, ahora no lo hacen y en consecuencia la imagen se distorsiona. Pero según la física relativista, cuando el objeto se mueve respecto del observador, los pulsos de luz también llegarían simultáneamente al plano del observador y mantendrían las mismas distancias relativas que guardaban al llegar a ese plano cuando el objeto y el observador se encontraban en reposo relativo: en consecuencia la imagen del objeto no se distorsiona con el movimiento. Pero entonces lo único que ha variado es el ángulo de los rayos paralelos provenientes del objeto: pasa de & cuando el objeto no se mueve a & cuando lo hace respecto del observador. Por tanto la imagen que se forma en el plano del observador aparece girada un ángulo. 8.5 Cuadrivectores, dinámica relativista y campo electromagnético Asociados con los eventos en el espacio de cuatro dimensiones de Minkowski, se pueden introducir vectores tetra-dimensionales denominados cuadrivectores. Los cuadrivectores resultan muy útiles para formular la dinámica relativista en el continuo tiempo-espacio, porque en forma natural sustituyen la descripción de las propiedades de los sistemas definidas en el espacio físico tridimensional por otras que las generalizan en el continuo tiempo-espacio de cuatro dimensiones. un punto, sino un segmento de recta de longitud L.? paralelo a la dirección de movimiento y situado por c atrás del punto que corresponde al extremo proximal de la varilla. La varilla aparece entonces rotada hacia atrás un ángulo p respecto de su posición "real", tal que V sen p = c 104

105 Respecto de un marco K los cuadrivectores poseen, como su nombre lo indica, cuatro componentes: una de ellas se denomina temporaloide porque se transforma como el tiempo al cambiar de marco de referencia, y las otras tres espacialoides, porque se transforman como el vector de posición. Si A es un cuadrivector, respecto de K se representa así: ( A)> = (a t, a r ) En esta representación a t es la componente temporaloide y a r representa las tres componentes espacialoides del cuadrivector. Respecto de otro marco: = (a t, a r ) Generalizando las fórmulas presentadas a comienzo del capítulo 7 para la transformación de las coordenadas de tiempo-espacio (t, r) de un evento, las fórmulas de Lorentz pueden escribir, para la transformación de las componentes de cualquier cuadrivector, de la siguiente forma: a t = r a r V a a. + (r-1). a r V V 2 1 V - y a t V c A partir de estas fórmulas se demuestra que el escalar a t 2 - a r a r permanece invariante al cambiar de un marco de referencia inercial a otro. Un primer ejemplo es el cuadrivector de posición témporo-espacial de un evento, que respecto de un marco de referencia K viene dado por: (4 = (c t, r) Utilizando el tiempo propio (Dt T como parámetro se define una cuadrivelocidad: )K V d T ) dt dt dt > dt dt dr ^ En esta representación, si v es la velocidad de la partícula respecto del marco K, dt Y=, 1 1 = (Se supone que esta fórmula se verifica también en el caso de una v partícula acelerada.) Por tanto, la componente temporaloide de la cuadrivelocidad es dx dx dx - = Y c mientras que las componentes espacialoides verifican L = y L siendo dt dt dt i = 1,2,3. Así pues: (DD) K = (/ c,/ v) Entonces el producto escalar (í/) k 1 depende del marco de referencia K). 'K y 2 c 2 - y 2 v 2 = c 2 es invariante (no Otro ejemplo de cuadrivector es P, el cuadrivector de energía-cantidad de movimiento lineal para una partícula: (E (P)k =, p V c ) donde E = m 0 / c p = m 0 v 105

106 Puesto que la masa propia se considera es invariante bajo las transformaciones de Lorentz, (.)> (.)> = j - p p = m 0 2 c 2 es independiente del marco de referencia. De sus definiciones se desprende que la cuadrivelocidad y el cuadrivector de energíacantidad de movimiento se relacionan con la masa en reposo de la partícula así: (. )> = o D )> Esta fórmula generaliza la relación p = m v movimiento de la mecánica newtoniana. entre la velocidad y la cantidad de En mecánica relativista se puede introducir un cuadrivector de potencia-fuerza derivando el cuadrivector de energía-cantidad de movimiento de una partícula respecto del tiempo propio de esa partícula e introduciendo las conexiónes relativistas entre la variación en la cantidad de movimiento y la fuerza, y la variación en la energía y potencia, estudiadas en 8.1: (i 7 )^ = (.)> dt 1 de" Y de" y( 7 \ La componente temporaloide del nuevo cuadrivector es = = [F v) c dt c d/ c dp dp mientras que las componentes espacialoides forman el vector = / = Y F dt d/ Esta formulación modificada de la versión relativista de la segunda ley de Newton, empleando cuadrivectores y el tiempo propio asociado a la partícula, se considera superior a la presentada en 9.1, puesto que como el tiempo propio es un invariante, mantiene la misma forma respecto de todos los marcos inerciales: lo único que cambia es la descomposición de los cuadrivectores. Esta descomposición depende en cada caso del marco de referencia de tiempo-espacio. Las fórmulas de transformación de las componentes temporaoide y espacialoide de un cuadrivector, aplicadas al cuadrivector de potencia fuerza (i 7 )> determinan cómo se transforma la fuerza F al cambiar de marco de referencia inercial. Se obtiene así un resultado que generaliza el presentado en Mientras que la fuerza que el campo electromagnético ejerce sobre una carga en movimiento (la fuerza de Lorentz) se transforma de esta forma y por lo tanto es compatible con la teoría restringida de la relatividad, la fuerza de interacción gravitatoria dada por la ley de Newton no lo hace. Por este motivo esta fuerza de atracción gravitatoria no se puede incorporar en un cuadrivector de potencia-fuerza. 7 En la teoría de Maxwell las cargas y sus movimientos son las fuentes del campo electromagnético. Se supone que la carga eléctrica es un invariante relativista, al igual que el número de partículas cargadas que componen un cierto sistema (cuando no se producen reacciones de formación o de aniquilación de pares). Entonces, introduciendo un marco auxiliar K 0 localmente en co-movimiento con un grupo de cargas, es posible deducir expresiones para la densidad de carga P q y la 106

107 densidad de corriente eléctrica 0 q (t, r) respecto de un marco de referencia K y la forma en que se transforman (en P q (t', 7') y 0 ' (t ' r ')) al pasar a describir los fenómenos respecto de un nuevo marco K' 90. Se encuentra así que la densidad de carga se transforma como el tiempo y las componentes de la densidad de corriente se transforman como las componentes del vector de posición. Se puede formar un cuadrivector [p q, 0 q ) K. En electrodinámica se demuestra que el campo eléctrico E (t, 7 ) y el campo magnético H (t, r) pueden expresarse en términos de un potencial escalar 0(t, r) y un potencial vectorial A(t, r) de componentes cartesianas A x (t, r) A y (t,r) A z (t, r): E (t, r )=-V0- - da c dt H (t, r ) = Vx A Como es usual en análisis vectorial, el producto vectorial Vx A del operador V por el campo A representa al rotor del campo. A partir de los potenciales escalar y vectorial se puede definir un cuadrivector (A )K = k A)K. ^ dax(t,r) da ' (t, 7) + daz (t, 7 ) = 0. Introduciendo la conexión ^x + dy + dz + dt = a partir de las ecuaciones de Maxwell se deduce que la componente temporaloide verifica una ecuación de ondas clásica cuyo término fuente es la densidad de carga, y que la componente espacialoide A(t, 7 ) densidad de corriente como término fuente del campo. verifica también una ecuación de ondas con la A partir del análisis del cuadrivector formado con los potenciales del campo y de las relaciones entre los potenciales y los campos se demuestra que los campos se transforman según las siguientes fórmulas al cambiar de marco de referencia: 7 E = y E + ((1 -y) ) E V r V +Y V x H V 2 c H 7 ' = y H ñ + (1 (i -y)) H V t7 V -Y V x E V 2 Estas fórmulas se pueden comparar con la que corresponde a la transformación de la componente espacialoide de un cuadrivector y resulta que son diferentes: desde el punto de vista relativista, E y H no son propiamente vectores. c 90 Sobre las definiciones de densidad de carga y de corriente en física relativista, así como el resto de los temas básicos de la formulación covariante del electromagnetismo, ver por ejemplo W. Mc Crea, "Física relativista", capítulo 8, UTHEA, México,

108 Un análisis más profundo arroja como resultado que E y H deben considerarse siempre en conjunto, como integrantes de un obbeto más complejo, el tensor del campo electromagnético. En particular, las fórmulas de transformación muestran que la presencia o la ausencia de E o de H tomados por separado depende del marco de referencia respecto del cual se describan esos campos. Resulta interesante que si el campo eléctrico se anula en un marco K, es decir E = 0, entonces en cualquier otro marco K' se tiene: E V X H 7 ' - / x H V 7 =Y H = Y H + (1 -Y) ^ V c V 2 Como el triple producto a (é X 7) se anula si dos factores son iguales, resulta que basta que respecto de un marco K el campo eléctrico sea nulo, para que respecto de otro marco K' cualquiera, los campos eléctrico y magnético ser perpendiculares entre sí: E H' = La fórmula para el tiempo propio de los relojes acelerados 91 En la formulación de la dinámica relativista utilizando cuadrivectores y el tiempo propio como parámetro, subsiste el problema, señalado en 7.3, que se plantea al utilizar la misma fórmula para el tiempo propio basada en la relación entre marcos inerciales para conectar un marco acelerado (el marco fijo a la partícula) con un marco inercial (respecto del cual la partícula posee la velocidad 7 ). Se suele argumentar que en cada instante medido respecto del marco inercial K se puede identificar un marco de referencia inercial que posee la misma velocidad v que la partícula en ese instante. Como esta velocidad puede variar con el paso del tiempo en el marco K, entonces el marco inercial en el que la partícula se encuentra instantáneamente en reposo debe variar: se tiene una familia de marcos inerciales tangentes, por así decirlo. Entre el incremento de tiempo propio AT que separa dos eventos que ocurren en el mismo lugar respecto de uno de estos marcos tangentes y el incremento de tiempo A/ medido en K que separa esos mismos dos eventos, se relacionan a través de la fórmula: A/ = 1 \ - í Luego se hace tender AT a cero y se interpreta el resultado obtenido dt como la relación entre un tiempo propio asignable a la partícula y el tiempo medido en de un marco inercial respecto del cual se describe el movimiento. 91 Esta parte se basa en el artículo de J. Ferrari y R. Suárez-Ántola "About the slowing down of accelerated clocks", Lettere al Nuovo Cimento, vol. 44, N 8, 1985, pp

109 Como se dijo en 7.3, esto debe ser introducido como una suposición adicional en el marco de la teoría restringida de la relatividad. Si se la admite, es necesario tener en cuenta que una de sus consecuencias es, al menos, problemática. Puesto quer 2 -T 1 = J1 - dt, si la velocidad está acotada por un valor inferior a c, al tender a infinito , tiende también a infinito T 2 -T 1. Pero si la velocidad, siempre estando acotada por c, se incrementara lo bastante rápido, r v 2 la integral J Í1 - dt podría ser convergente. Si así fuera, parte de la evolución del observador acelerado (cronometrada por su tiempo propio T ) debería ocurrir fuera del universo accesible al observador inercial (cronometrada por el tiempo t). A este último "se le acabaría el tiempo" (t ) mientras que el tiempo propio del observador acelerado se mantendría finito. En ese caso el observador acelerado vería desaparecer al observador inercial. Veamos ahora bajo qué condiciones esto podría ocurrir, si se asume la validez irrestricta de la fórmula integral para el tiempo propio. Considerando, para simplificar, el movimiento de una partícula en una dimensión espacial, a partir de las ecuaciones ( mo.y. v ) = F( t ), Y'- dt v v 1 - c 2 J y p = m o Yv se deduce, v 2 i h - dt = 1 + (t) 1-2 P2 2 2 m c L Como p(t) = p(t o ) +1F(t'\dt', es posible -1 demostrar que Í1 - Y dt diverge siempre y cuando F(t').dt' dt sea divergente. Si, por ejemplo, F(t) = ln t esta condición se cumple, mientras que si F(t) = t p con p > 0 ya no se cumple y entonces J1 -, d t converge. Si el movimiento se produce en un campo de fuerzas estacionario F(x), de la ley del movimiento se obtiene, luego de varias transformaciones: '(X)-T(XO ) = 1 I n J 1 + m 0 2 c 2 F(x') dx" -1 dx' -1 CO X Esta integral diverge siempre y cuando la integral F(x')- dx' dx sea divergente. Lo es, por ejemplo, paraf(x) = lnx, pero la integral converge para F(x) = x p con p >

110 Entonces, si admitimos que j ^ 1 - C_ di no puede ser convergente (con el fin de evitar 'o la paradoja que constituye la desaparición del observador inercial del universo del observador acelerado), solamente deberíamos encontrar en la naturaleza campos de fuerza medidos respecto del observador inercial y actuando sobre el observador acelerado para los cuales la integral sea divergente. / v r La alternativa para evitar la paradoja es que T 2 - T 1 = L 1 - di constituye solo una c 'i buena aproximación a la verdadera ecuación de transformación, aproximación cuyos límites de validez no pueden ser establecidos en el marco de la teoría restringida de la relatividad. Como se verá en el capítulo 13, a propósito de los agujeros negros, el problema se vuelve a plantear, pero ahora en el marco de la teoría generalizada. 8.7 Algunos resultados relacionados con la mecánica de fluidos y la termodinámica relativistas El estudio de la mecánica de fluidos relativista presenta considerable interés científico, sobre todo en relación con ciertos problemas astrofísicos y cosmológicos. Aunque ciertamente en menor medida, cabe esperar que durante este siglo presente un interés tecnológico creciente. Cuando las velocidades del movimiento microscópico de las partículas del fluido no son despreciables respecto de la velocidad de la luz, las ecuaciones del movimiento deben tener en cuenta efectos relativistas aún cuando las velocidades macroscópicas del medio sean pequeñas en comparación con la de la luz. A diferencia de lo ocurrido con las variables de la mecánica de fluidos no relacionadas con la termodinámica, las leyes de transformación de las variables termodinámicas han suscitado numerosas discusiones y desacuerdos que se iniciaron hace 100 años y se han extendido hasta el presente. Aún hoy la pregunta acerca de si una termodinámica relativista tiene sentido como disciplina física, y si lo tiene, cómo debe ser formulada, no posee una respuesta aceptada en forma unánime por la comunidad científica. En la medida en que la termodinámica y la mecánica de fluidos se puedan aplicar en estudios sobre la estructura, el origen y la evolución del Universo, también presenta interés desde una perspectiva filosófica. Comencemos con la presión, en el caso de un fluido ideal. Supongamos que el fluido se encuentra en reposo respecto de un marco de referencia inercial K' cuyo eje x' se mueve con velocidad v, paralelamente al eje x de otro marco de referencia inercial K. La presión respecto de K' se define como es usual y adopta un valor P' que en cada punto toma el mismo valor con independencia de la orientación del elemento de superficie utilizado para definirla. En particular, representando la fuerza de compresión por unidad de área ortogonal a un eje mediante un subíndice que representa a dicho eje, se tiene: P' = P,, = P' 110

111 La fuerza paralela al eje x' debida a la presión ejercida sobre un elemento de área Ay AZ viene dada por FX =.X Ay' AZ'. Las fuerzas ejercidas sobre los otros dos elementos de área son F y =.y AX' AZ' y F( =.X AX' Ay'. En lo que sigue supondremos que los elementos de área son físicamente infinitesimales. En ese caso el elemento de volumen A?' = AX' Ay AZ también lo será. Respecto del marco K tenemos las tres fuerzas debidas a la presión: 3x =.X Ay AZ 3y =.y AX AZ F Z = P z AX Ay Aplicando las leyes de transformación mostradas en 8.1.3, teniendo en cuenta que como el fluido se encuentra en reposo respecto de K' se debe poner v = 0, resulta: F = F ' F = X X y 1 v 2 F ' F = c 2 y Z 1 - V 2 F ( ' Por otro lado, teniendo en cuenta la contracción de Fitz-Gerald que aparece en dirección del eje x, se tienen las leyes de transformación de los elementos de área: Ay AZ = Ay' AZ ' AX AZ AX AZ AX Ay 1 - AX' Ay' c2 c2 1 v2 De estas leyes de transformación y de las fórmulas para las componentes de las fuerzas en función de las presiones se desprende que.x =. X.y =. y. z =. z. Pero como.x =.j = =.', resulta que. X =. y =. z =. y por tanto.' =.: la presión es un invariante relativista, es decir, un verdadero escalar. A su vez los elementos de volumen físicamente infinitesimales A? y A?' se v2 encuentran conectados por la relación A? = J1 - A? Todo lo anterior desde un punto de vista de mecánica de medios continuos. Desde el punto de vista microscópico propio de la teoría cinética molecular, la presión se interpreta como la velocidad de transferencia de cantidad de movimiento por unidad de área de una pared. Aplicando las leyes de transformación relativistas se deduce 1 r 92 nuevamente que la presión es un invariante. Si el volumen del sistema material es finito, y si dos observadores, situados en marcos de referencia diferentes, definen el volumen a partir de la región que para cada uno de ellos se encuentra ocupada simultáneamente por las partículas del sistema, aparece la 93 dificultad derivada del entrelazamiento del tiempo y el espacio señalado en la sección 7.2 sobre la relatividad del espacio físico. c 2 Z 92 Dos enfoques distintos y complementarios de la mecánica de fluidos relativista pueden encontrarse en el capítulo 8 del libro de J. L. Synge "Ee/aí/'v/'/y: /&e spec/'a/ í&eory", North-Holland, Amsterdam, 2 a edición, 1965, y en el capítulo 15 del libro de L. Landau y E. Lifchitz "Mecán/'ca de T/w/'dos", Reverté, Barcelona, El primero es más riguroso y completo en el planteo matemático pero, a diferencia del segundo, no aborda los fenómenos disipativos. 93 T. Nakamura "Covariant thermodynamics of an object with finite volume", Physics letters A, Vol. 352, 2006, pp Ill

112 La física relativista vincula las coordenadas de tiempo-espacio de un evento y las componentes de una cantidad física (como la cuadrivelocidad, el cuadrivector de energía-cantidad de movimiento o el cuadrivector potencia-fuerza) asignados a ese evento en un marco inercial K, con las coordenadas de ese mismo evento y las componentes de esas mismas cantidades físicas asignadas a ese mismo evento pero referidas a otro marco inercial K\ Ese vínculo se establece en relatividad restringida utilizando las transformaciones de Lorentz. Pero si la cantidad física no tiene un carácter local, como por ejemplo no lo tienen las cantidades aditivas tales como el volumen de un cuerpo material, la cantidad de movimiento de un sistema de partículas, o su momento angular, es necesario definir cómo se va a manejar el problema de la simultaneidad de eventos que acontecen en puntos diferentes, cuando se busca relacionar los valores de la cantidad en cuestión referidos a dos marcos inerciales diferentes. Una posibilidad es trabajar con el mismo conjunto de eventos, aceptando que las cantidades locales que se adicionan y que aparecen como simultáneas para un observador, no sean necesariamente simultáneas para otro observador. Esto permite relacionar las cantidades mediante transformaciones de Lorentz, porque ambos observadores están trabajando con el mismo conjunto de eventos: se puede denominar procedimiento covariante. Otra posibilidad es decidirse a trabajar con eventos simultáneos en el marco de referencia de cada uno de los observadores, aceptando que a pesar de que los dos se ocupan del mismo sistema (el mismo tubo de universo en el espacio de Minkowski) ya no trabajan con los mismos eventos, y por tanto al no tratarse de los mismos eventos no pueden conectar sus componentes mediante transformaciones de Lorentz. Como consecuencia las cantidades físicas no locales en general ya no van a ser las mismas, en el sentido de la física relativista, para los dos observadores: este segundo procedimiento no es covariante y puede conducir a resultados aparentemente paradójicos cuando no se lo distingue del primero 94. En particular, si siguiendo el segundo procedimiento, se construye un nuevo objeto matemático adicionando los cuadrivectores de energía-cantidad de movimiento correspondientes a diferentes elementos de masa de un cuerpo de volumen finito tomados en forma simultánea respecto de cada observador, en general no se obtiene una entidad covariante (es decir, invariante bajo una transformación de Lorentz) 95. Esta es una de las dificultades que se plantean a propósito de la formulación de una mecánica de fluidos y una termodinámica relativistas. A. Gamba "Physical quantities in different reference systems according to relativity", American Journal of Physics, Vol. 35, 1967, pp No obstante, Moller, en la última edición de su libro "The theory of relativity", Oxford University Press, Londres, 1972, señala que para un cuerpo aislado se puede construir un cuadrivector energíacantidad de movimiento. Tanto en mecánica de fluidos como en termodinámica es necesario considerar cuerpos en interacción con el medio que los rodea. Por ejemplo cuerpos sometidos a presión, es decir, a un flujo de cantidad de movimiento procedente de su ambiente. 112

113 Hay una forma directa de evitar las dificultades que acarrea el segundo procedimiento, que ha resultado muy exitosa al ser aplicada en mecánica de fluidos relativista 96. Consiste en considerar un marco inercial K 0 que en ese instante se halla en reposo respecto de un elemento de masa del fluido (se denomina marco localmente en comovimiento con el fluido). Si el fluido es ideal, su estado puede describirse mediante dos variables: la densidad local (densidad propia) de energía interna e 0 y la presión p (la presión es un invariante relativista de modo que p 0 = p). La velocidad local del fluido es nula. A partir de estas dos cantidades se construye una versión 1 ocal (en un punto del medio continuo) del cuadrivector energía-cantidad de movimiento que se puede referir a cualquier marco inercial K. Se trata de un objeto matemático que respecto a cada marco de referencia se caracteriza por 16 componentes, organizadas en un arreglo matricial simétrico de 4*4. Es el denominado tensor de energía-impulsión. Las componentes T i. del tensor (i, j = 0,1,2,3 donde el sub-índice 0 alude al tiempo asociado con la coordenada x 0 = c t y los sub-índices 1, 2, 3 se refieren a las componentes x 1 = x, x 2 = y, x 3 = z de un sistema de coordenadas cartesianas ortogonales) se modifican en forma covariante al cambiar el marco inercial (el tensor mantiene su estructura inalterada bajo las transformaciones de Lorentz). Por ejemplo, para la velocidad local v(t,r) de una partícula de fluido sus componentes cartesianas se representan ahora mediante v 1, v 2 y v 3. Si introducimos el valor local de la cuadrivelocidad relativa (()> = c ( 1 r ^ 7,7 -v c fluido respecto de un marco K, las componentes del tensor de energía-impulsión se definen así, siendo y 2 = : T 00 =(e 0 + p) y 2 - p = y 2 ( v 2 ^ e 0 + P c V J -S 2w = 2,0 = (e0 + p) y 2 v. j = 1, 2, 3 T h] = (e Q + p) y 2 v, v ; + p S,, ; i, j = 1, 2, 3 Como es usual, S Uj es igual a 1 cuando i = j y es igual a cero cuando i * j. Constituye una generalización covariante del cuadrivector de energía-cantidad de movimiento, pero restringida a un punto del medio. A partir de las componentes del tensor de energía-impulsión se pueden escribir en forma covariante dos ecuaciones del movimiento para el fluido perfecto en ausencia de fuerzas de volumen (como las fuerzas electromagnéticas sobre un fluido con carga eléctrica que se consideran en la magneto-hidrodinámica). i -.11 ^ d2 00 dt m dt m dt 03 La ecuación de conservación de la energía: = 0 dx 0 oxj ox 2 dx 3 Las ecuaciones de conservación de la cantidad de movimiento (impulsión): JK del 96 Ver el capítulo 15 de L. Landau y E. Lifchitz "Mecánica de fluidos", Reverté, Barcelona,

114 = o 7 = 1,2,3 dx o 3X 1 dx 2 dx 3 d2 Ambas ecuaciones se pueden resumir en una única ley de conservación: ^ ^ '' = 0 El cuadrivector ^ 7 ' se conoce como cuadridivergencia del tensor de energíaimpulsión. 3 Para completar las ecuaciones que describen el comportamiento relativista del fluido es necesario añadir una ecuación de conservación del número de partículas y una relación entre la densidad de energía y la presión. En forma análoga a la utilizada para definir el tensor de energía-impulsión, se define un cuadrivector local denominado corriente de partículas: W* = «o' ' ( D )j = ( «o' Y'«o Y--' 1 v l - J * La variable «O (i, r) que aparece en ambas componentes, temporaloide «O - Y y espacialoide «o - Y' 1 ' r de la corriente de partículas, es por definición un escalar - (invariante relativista): es el número de partículas por unidad de volumen determinado respecto al marco K o, es decir, la densidad propia de partículas. Entonces la ley de conservación del número de partículas se escribe así: ^ ( «o -Y) + ^ [ «o 'Y' -' Vi l + ( «o 'Y' 1 ' V2 l + [ «o 'Y' 1 ' V3 = o dx o dx 1 V - J dx 2 V - J dx 3 V - J Cuando las velocidades asociadas al movimiento macroscópico del fluido, es decir las magnitudes de los valores del campo V(i, r) (cuyas componentes cartesianas son v x (/, r), v y (Í, r) y v z (Í, r)) son pequeñas respecto de reducen a las siguientes: 3 i=0 d x i -, las ecuaciones del movimiento se ( _ ^ ^ ^ (.. ^ Po ' P üv = _vp P + r.(vpo )+Po P v p o ' - J di di v p o' - 2 J V* V = o En estas ecuaciones introdujimos la densidad de masa propia p o asociada a la energía interna propia del fluido: e o = p o ' - Como siempre, Vp y Vp o representan los campos vectoriales gradiente, cuyas componentes cartesianas son las derivadas parciales de los campos escalares p(i, r) y p o (i, r) respecto de las coordenadas X, y, z. dv Por otra parte, representa, como es usual en mecánica de fluidos clásica, la derivada di dv dv / w r dv x d v y dv z siguiendo el movimiento = + (v V )v mientras que V v = I - I di di OX dy dz es la divergencia del campo de velocidades del fluido y el operador (v V) se expresa en coordenadas cartesianas así: (r V) = V X ' -d- + v y ' -d + v z ' -d. dx dy dz 114

115 Si además de tener velocidades macroscópicas pequeñas respecto de la velocidad de la 2 luz, se tienen presiones p pequeñas respecto de p 0 c, resultan las ecuaciones clásicas de la dinámica de un fluido ideal en ausencia de fuerzas de volumen: Pe ^T = ~Vp dt P ót + V (VP0 ) + P0 V^ v = 0 La relación constitutiva entre la energía interna e 0 y la presión p = p 0 conecta la mecánica de fluidos con la termodinámica, debido a que cabe esperar que en esa relación aparezca la temperatura local T del fluido. Nos deja en medio del problema de la termodinámica relativista y la discusión acerca de las leyes de transformación de la temperatura T y el calor Q al cambiar de marco de referencia. Casi desde que comenzaron los trabajos tendientes a hallar una formulación covariante para la termodinámica hubo un cierto consenso acerca de que la entropía es un invariante relativista. Como consecuencia de la relación T ds = SQ que conecta una variación de la entropía (variable de estado) con la temperatura y con una pequeña cantidad de calor SQ intercambiado entre el sistema y su ambiente, la temperatura absoluta y el calor deben transformarse igual al pasar de un marco de referencia a otro. Desde el trabajo pionero de K. von Monsegeil (un alumno de doctorado de Planck fallecido prematuramente en un accidente) en 1907 hasta el replanteo debido a H. Ott en 1963, por lo general se admitía que la temperatura T y el calor intercambiado Q referidos a un marco K respecto del cual el sistema termodinámico se encontraba en movimiento con velocidad v se relacionan con los valores propios T 0 y Q 0 de esas mismas variables referidas a un marco en co-movimiento con el sistema por las fórmulas: T = T 0 y Q = 1 Q 0 Y Y Por su parte Ott inició formalmente una segunda corriente de opinión que sostiene que las fórmulas correctas son: T = y T 0 y Q = y Q 0. En 1969, Van Kampen inició una tercera corriente de opinión proponiendo que tanto la temperatura absoluta como el calor intercambiado son invariantes relativistas: T = T 0 y Q = Qc Otros han propuesto que la temperatura es invariante mientras que el calor no lo es, o han propuesto fórmulas para expresar la covariancia diferentes a las expuestas previamente, o han llegado a la conclusión que el intento de formulación covariante de 97 la termodinámica carece de sentido. Hay dos formas de evitar el problema. Una es suponer para un fluido ideal una relación entre e 0 y p solamente. La otra consiste en trabajar siempre con variables termodinámicas propias, medidas en un marco en co-movimiento local con el fluido perfecto. Así, en la relación constitutiva aparece la temperatura propia T 0. Como en 97 Ver H. Callen y G. Horwitz "Relativistic thermodynamics", American Journal of Physics, Vol. 39, 1971, pp y M. Requardt "Thermodynamics meets special relativity- or what is real in physics?" arxiv: v1 (gr-qc),

116 nuestro caso el interés por la termodinámica relativista se vincula con la construcción de modelos cosmológicos que se discute en el capítulo 12, adoptaremos este último punto de vista. 8.8 Las relaciones epistemológicas entre las teorías de la física clásica luego de ser aceptada la teoría restringida de la relatividad Para finalizar este capítulo, consideremos desde un punto de vista epistemológico, las nuevas relaciones entre las teorías físicas cuando aparece la física relativista en 19o5, y hasta 1915, antes de aparecer la teoría generalizada. El siguiente esquema describe las relaciones de dominio, compatibilidad o inconsistencia que se presentan entre la teoría restringida de la relatividad, la mecánica newtoniana de partículas y la teoría electromagnética. La flecha indica el dominio de la teoría restringida sobre la mecánica newtoniana. Esta se obtiene como caso límite de la dinámica relativista haciendo tender a infinito la velocidad de la luz. El segmento de línea continua que conecta la relatividad restringida con la teoría electromagnética representa la compatibilidad entre ambas teorías, sin que una domine sobre la otra. La línea de trazo punteado representa la inconsistencia entre la mecánica newtoniana de partículas y la teoría electromagnética. TEORÍA ELECTROMAGNÉTICA MECÁNICA NEWTONIANA DE PARTÍCULAS No se ha incluido la termo-mecánica de medios continuos, puesto que ni sus versiones newtonianas ni sus versiones relativistas han alcanzado el grado de completitud (y aceptación, en el caso relativista) alcanzado por la mecánica de partículas, tanto newtoniana como relativista. La teoría de la gravitación de Newton permaneció como una teoría de acción a distancia, inexplicada e incompatible con la física relativista, hasta que en 1915 fue superada por una nueva teoría, relativista, del campo gravitatorio. El concepto de límite clásico, aceptado por los físicos, según el cual las fórmulas de la mecánica de Newton se obtienen como aproximación a partir de las fórmulas de la 116

117 mecánica relativista cuando las velocidades de los cuerpos son pequeñas respecto de la velocidad de la luz ha sido objetado por algunos filósofos de la ciencia, desde Thomas Kuhn hasta Paul Feyeraband. Estos pensadores enfatizan la inconmensurabilidad entre una y otra mecánica, y en 98 general entre teorías separadas por un cambio de paradigma : "Con el paso de una teoría a la que le sigue, las palabras transforman sus significados o las condiciones de su aplicabilidad de una forma muy sutil. Aunque en buena medida se utilizan los mismos signos antes y después de la revolución- por ejemplo, fuerza, masa, elemento, compuesto, célula- se ha modificado de alguna manera el tipo y el modo de su aplicación a la naturaleza. Por ello decimos que las teorías sucesivas son inconmensurables." 99 Cuando varía lo suficiente el significado de los términos, la traducción de uno de los lenguajes teóricos al otro ya no resulta posible y como consecuencia de ello los contenidos de las teorías no pueden ser comparados. Por ejemplo, la palabra masa en la mecánica newtoniana no tiene el mismo significado que en mecánica relativista, puesto que en la primera se encuentra sujeta a una ley de conservación mientras que en la segunda, su homóloga, la masa inercial, puede desaparecer siempre que se conserve la energía 100. Lo mismo ocurre con el tiempo y el espacio, independientes entre sí en mecánica newtoniana e interrelacionados en mecánica relativista. Un problema similar se plantea a propósito del concepto de fuerza. Introducido originalmente en el contexto de la estática, es posible trasladarlo a la mecánica relativista mientras se añada la restricción de equilibrio de fuerzas. No obstante, extendido a la dinámica, el concepto newtoniano de fuerza implica la tercera ley de Newton: igualdad de acción y reacción entre cuerpos situados en puntos del espacio distantes, en cada instante de tiempo. Para que la tercera ley se verifique respecto de todo marco de referencia posible, como se asume en mecánica newtoniana, es necesario que se verifique la simultaneidad absoluta de eventos en puntos diferentes. En consecuencia el concepto newtoniano de fuerza no resulta traducible al lenguaje de 98 En líneas generales se pueden distinguir dos etapas que se repiten durante el desarrollo histórico de las teorías físicas. En una de esas etapas la teoría dominante ha alcanzado un grado de completitud tal que no puede ser significativamente mejorada introduciendo pequeñas modificaciones. Se ha alcanzado el estadio de una teoría cerrada en el sentido definido por Heisenberg en su artículo "Der Begriff abgeschlossene Theorie in der moderne Naturwissenschaft", Dialectica, vol. 2, 1948, pp Corresponde a lo que Kuhn ("La estructura de las revoluciones científicas", FCE, Madrid y México, 2 a edición, 1976) propuso en 1962 denominar etapa de ciencia normal, gobernada por un paradigma característico, que en ese momento resulta muy fructífero. En la siguiente etapa aparecen dificultades que no pueden resolverse en el marco de la teoría establecida. El paradigma es cuestionado y finalmente resulta sustituido por otro en el marco de la elaboración de una nueva teoría que termina por sustituir a la anterior. Este proceso de cambio de paradigma es denominado, a propuesta de Kuhn, revolución científica. Los límites de aplicabilidad de la vieja teoría solo se comprenden en el marco de la teoría nueva. Esta se cierra a su vez dando paso a una nueva etapa de ciencia normal en torno al correspondiente paradigma. 99 T. Kuhn "La estructura de las revoluciones científicas", FCE, Madrid y México, 2* edición, 1976, sección Esto último puede acontecer aunque la velocidad de las partículas sea pequeña respecto de la velocidad de la luz es decir, en el límite newtoniano, como se constata en las reacciones nucleares de fisión del tipo de las que se producen en reactores de investigación o de potencia. 117

118 la teoría de la relatividad. Es incompatible con el concepto de fuerza relativista, excepto en un único caso: si nos restringimos a las fuerzas de contacto, como la presión en un medio continuo, puesto que entonces acción y reacción se refieren siempre al mismo punto del espacio. Pero la traducibilidad estricta no es un requisito necesario para poder comparar teorías en física. Como señala Rivadulla, en física lo decisivo para poder comparar dos teorías, por lo demás inconmensurables, es la identificación de homologías entre los términos propios de los lenguajes de esas teorías y el balance predictivo de cada una, es decir, la capacidad de dar cuenta de las relaciones empíricas conocidas y de predecir nuevas relaciones.^1 La masa en mecánica newtoniana es homóloga a la masa en reposo de la dinámica relativista, los componentes espacialoides del cuadrivector de energía-cantidad de movimiento son homólogos a la cantidad de movimiento de la mecánica clásica, y las componentes espacialoides en la igualdad entre el cuadrivector de potencia-fuerza y la derivada respecto del tiempo propio del cuadrivector de energía-cantidad de movimiento, son homólogas a las componentes escalares de la igualdad vectorial que expresa la segunda ley de Newton como relación entre la fuerza y la velocidad de cambio en la cantidad de movimiento. Estas homologías permiten aplicar el principio de consistencia planteado en 8.1, según el cual la mecánica basada en la teoría restringida de la relatividad, que pretende reemplazar a la mecánica de Newton, debe dar cuenta de todas las predicciones exitosas de esta última. 101 A. Rivadulla "MX7ÍO, raz$«y -aw 7o e«_/zs7-a: e«/ógwe 7«sirwwe«ia/ e«ieor/a de /a «^««'a", Trotta, Madrid, 2oo4, capítulo

119 9 Espacios curvos "Gauss (1827) hizo el primer estudio sistemático de las formas diferenciales cuadráticas en sus "Disquisitiones generales circa superficies curvas", en las que el tema principal es la curvatura de las superficies... Dando el paso final en esta dirección, Riemann, en una de las contribuciones más prolíficas hechas a la geometría, pasó de inmediato a la forma diferencial cuadrática general en n variables, con coeficientes variables, en su "Uber die Hypothesen welche der Geometrie zu Grunde liegen", La matemática de la geometría de Riemann entrelaza dos temas fundamentales: una generalización del teorema de Pitágoras para cualquier espacio (variedad numérica) de n dimensiones y la curvatura en esos espacios....hizo entonces la notable conjetura de que su nueva métrica reduciría a geometría pura las cuestiones relativas al universo material y a las fuerzas de enlace que lo mantendrían unido. " E. Bell "The development of mathematics", Mc Graw-Hill, New York, Debido a la igualdad entre la masa inercial y la masa gravitatoria, los movimientos en un campo gravitatorio poseen la misma aceleración en el mismo punto y en el mismo instante. En consecuencia, siempre que las condiciones iniciales hayan sido las mismas, todos los cuerpos de prueba se mueven de la misma forma, siguiendo la misma trayectoria, independientemente de sus masas o cargas eléctricas. Esto no se observa en el caso de los movimientos en un campo electromagnético, debido a que la aceleración depende ahora del cociente entre la carga eléctrica y la masa inercial, cociente que en general es diferente para cuerpos diferentes. La idea subyacente a la teoría generalizada de la relatividad es que la igualdad entre la masa inercial y la masa gravitatoria se hace comprensible si el movimiento en un campo gravitatorio se concibe como un movimiento libre de fuerzas en un tiempo-espacio curvo. 9.1 Teoría de superficies y geometrías intrínsecas 102 La introducción de la idea de un espacio curvo conduce a la consideración de las geometrías no euclidianas, y en particular a las geometrías de Riemann en el caso de la teoría de la relatividad. Antes de considerar estas geometrías, es conveniente revisar la teoría clásica de superficies en el espacio euclidiano E 3 y el concepto de geometría intrínseca a una superficie en dicho espacio. 102 Una presentación resumida de los temas fundamentales de geometría diferencial clásica se puede encontrar, por ejemplo, en el libro de H. Coxeter "Introduction to geometry", Parte 4, Wiley, New York, 1980, y en el capítulo 14 del volumen 2 del libro de H. Ewes "Estudio de las geometrías", UTHEA, México, Un tratamiento más detallado y avanzado se encuentra en los libros de D. Struik "Geometría diferencial clásica", Aguilar, Madrid, 1966, y de H. Guggenheimer "Differential geometry", Dover, N.Y.,

120 9.1.1 Curvas, superficies y curvaturas en E 3. Comencemos por revisar el concepto de curvatura de una curva plana, dada por una función regular y = f (X). En términos que apelan a la intuición, podemos decir que la curvatura se introduce como una medida de la rapidez con que rota la recta tangente a medida que pasamos de un punto de la curva a otro próximo. Para que la curvatura sea independiente de la orientación de la curva en el plano, se define como el límite del cociente entre el ángulo Aa que forman las rectas tangentes en dos puntos y la longitud As del arco de curva que tiene a esos puntos como extremos, manteniendo un punto fijo y aproximando el otro: 1 = li m f A a ^ ^ As Introduciendo la abscisa X para expresar tanto la longitud de arco s(x) como el ángulo a(x) entre la recta tangente a la curva en el punto (X, f (X)) y el eje x, y representando las derivadas primera y segunda por /'y /" se obtiene la fórmula bien conocida 1o! : / '(xo) 1 (Xo ) = (1 + [/'(Xo )] 2 ) 2 Se puede definir un radio de curvatura mediante la relación E(x o ) =. I 1 ( x o ) Debido a cómo se definen, resulta evidente que tanto la curvatura como el radio de curvatura son propiedades locales. Desarrollemos en serie de Taylor la función y = f (X) en torno a un punto de abscisa x o hasta el orden dos inclusive, representando con o( ), como es usual, un infinitésimo de orden superior al de su argumento: y = /(X) = /(xo) + /'(xo )-(X - Xo) + 2 /'(xo )-(X - Xo ) 2 + O ( (X - Xo ) 2) Rotemos los ejes de coordenadas y traslademos el origen al punto (x o, f (x o )), de modo que el nuevo eje de abscisas y coincida con la recta tangente a la curva en el punto (x o, f (x o )) y el nuevo eje de ordenadas y mida el apartamiento de la curva de la mencionada recta tangente. En los nuevos ejes la misma curva se representa mediante la función y = g( y ) cuyo desarrollo de Taylor es ahora: y = g (t ) = 2 g "(o)-y 2 + 0(y 2 ) La curvatura de la curva plana se calcula empleando las nuevas coordenadas aplicando la fórmula de la curvatura para este caso: 1 (o) = g ''(o) (1 + [g '(o)] 2 )3 1 f 2 t = g''(o) = liml I Como la nueva ordenada mide el apartamiento de la curva respecto de la recta tangente en el punto considerado (el punto cuyas coordenadas originales son (x o, f (x o ))), la y j Teniendo en cuenta que a(x) = arcíg (f '(X)) y que s(x) = ^ 1 + [/'(X)] 2 dx 120

121 fórmula aplicada a la representación de la curva en las nuevas coordenadas muestra que la curvatura describe la rapidez con que la curva abandona la tangente (Figura 9.1). Figura 9.1 Apartamiento de la curva respecto de la tangente En el caso de una superficie orientable (bilátera) regular E, parecería razonable describir su curvatura en un punto dado mediante la rapidez con que dicha superficie se separa de su plano tangente en el punto. Como en direcciones diferentes la superficie puede separase de su plano tangente con diferente rapidez 104, una forma de implementar esta idea es asignarle las curvaturas de curvas planas contenidas en la superficie y que pasan por el punto considerado en todas las direcciones posibles. Para ello, se construye la recta normal al plano tangente en el punto, la denominada normal a la superficie en el punto. Luego se construyen todos los planos que pasan por esa normal (planos normales) y se intersecan con E. A cada plano se le puede asignar un ángulo (, formado por dos rectas dirigidas, situadas en el plano tangente: una de ellas es fija, y la otra es la intersección del plano normal con el plano tangente. Se obtiene el conjunto de curvas planas (conocidas como secciones normales) que se buscaba: pasan por el punto en todas las direcciones posibles y a cada una se le puede calcular la curvatura k N (f) en el punto. Pero la dependencia entre la curvatura y la dirección de la curva no es arbitraria: la curvatura de una superficie en un punto se puede caracterizar por dos parámetros. Para verlo, consideremos una superficie E dada por la función regular z = f (x,y), donde x,y,z son coordenadas cartesianas ortogonales. En un punto (x 0, y 0, z 0 ) con z 0 = f (x 0, y 0 ) el plano tangente viene dado por la función lineal p(x,y) = f (x 0, ^ -(x - X0 -(y - y 0 ) dx dx El apartamiento de la superficie respecto del plano tangente puede expresarse mediante un reordenamiento del desarrollo de Taylor de z = f f (x, y) - p (x, y ) = (x,y): d 2/(x c " ).(x - x0 ) ^IfeZi)-(x - x0 )-(y - y,.(y - ^ ) 2 2 V- -o, - v -o, ss yo,- v s o, + o((x-x 0 dx 2 dx-dy dy 2 )2 + ( y - y0 )2) Trasladamos el origen de coordenadas al punto (x 0,_y 0,z 0 ) y rotemos los ejes de modo 104 Para verlo basta pensar en lo que ocurre en las proximidades de un punto ubicado sobre una superficie cilindrica cuando se construye el plano tangente por ese punto. 121

122 que los nuevos ejes x,y se encuentren en el plano tangente y el nuevo eje y con la normal a la superficie en (x o, y o, z o ). coincida Es posible ajustar la posición de los ejes y,y en el plano tangente para que se anule en dg (y, y) el origen la derivada cruzada dx dy de la función z = g(x, y )que representa a E en las nuevas coordenadas. Entonces una medida del apartamiento de la superficie respecto de su plano tangente viene dada por: y = g (y,y ) = 1 "d 2 g(o,o) y2, d 2 g(o,o) y2 X + rr-^ y + o(y 2 + y 2 ) Figura 9.2 Apartamiento de la superficie respecto del plano tangente. Si el ángulo < de un plano normal se mide respecto del eje X, y se introduce un sistema de coordenadas polares p, <, como en ese caso y = p cos< y y = p sen<, la curva plana determinada por la intersección del plano normal con la superficie viene dada por: ' = (p) = g(p cos <, p sen<) = P ḏ 2 g(o,o) 2. d 2 g(o,o) 2, cos 2 < + J' ' sen < 3X 2 dy 2 + o(p 2 ) Entonces teniendo en cuenta que la curvatura en el origen viene dada por f 2 y I 1' (<) = lim p^o p / para z = (p), resulta el teorema de curvatura debido a Euler: 1' (<) = 1 1 cos 2 < +1 2 sen 2 < 3 E En esta t f- fórmula, i por d definición, f t1 2 g(o,o), d 2 1 = y 1 2 = g(o,o). dx Entonces en un entorno del punto (x o, y o, z o ) (o sea del punto X = y = z = o ) la superficie se puede representar así: z = 1 1 X y 2 + o(x 2 + y 2 ) Dependiendo del comportamiento de la superficie en un entorno del punto (x o, y o, z o ) 1 1 y 1 2 pueden tener el mismo signo o signo opuesto, o bien anularse uno o ambos dy 122

123 números. Si tienen el mismo signo la superficie se dispone localmente de un mismo lado del plano tangente, como un cuenco: el punto se denomina elíptico. Si poseen signo opuesto la superficie se ubica localmente a ambos lados del plano tangente, al cual atraviesa, como una silla de montar: el punto se denomina hiperbólico. Si uno de estos números es cero y el otro no lo es, el punto se denomina parabólico. Si ambos son iguales se trata de un punto umbílico. Si son nulos se denomina punto plano y la determinación del comportamiento local de la superficie requiere un estudio basado en los términos superiores al segundo en el desarrollo de Taylor de la función z = g(x, t). Si k 1 y k 2 toman valores diferentes, digamos si k 1 > k 2, el examen de la fórmula k N (f) = k 1 - cos 2 ( + k 2 - sen 2 ( en la superficie y en un plano normal. muestra que k 1 > k N (f) > k 2 para toda curva contenida Las curvaturas extremas se alcanzan en dos direcciones ortogonales, para f = 0 y para n f =, que se denominan direcciones principales. Las curvas planas cuyas curvaturas son kj y k 2 se denominan secciones principales, y esas curvaturas se denominan curvaturas principales. Son los dos parámetros que en general determinan la curvatura kn (f) de cualquier sección normal. A menos de un signo, esas curvaturas son recíprocas de los denominados radios de curvatura principales y de esa superficie en el punto considerado. Si cortamos la superficie por un plano que pasa por el punto P considerado pero no pasa por la normal a la superficie en ese punto, tenemos una sección plana, pero que ya no es una sección normal. Si O es el ángulo que el plano oblicuo forma con la normal, la distancia entre la curva plana oblicua y el plano tangente, determinada sobre el plano oblicuo de la curva, es h e (o)= M I. Cuanto más oblicuo es el plano, mayor es \h O (p) respecto de \h N (p) coso Entonces aplicando la fórmula para calcular la curvatura en el punto P, es decir f' k(f) = li 2 h(p) 1 r>htpnpmr>e pi tmrpma rlphirlr> n IVTpiienipr' m ' n^p), obtenemos el teorema debido a Meusnier: k(f): p^0 p 2 coso Se ve que la magnitud de la curvatura de la sección normal en un punto es menor que las curvaturas de las secciones oblicuas en ese mismo punto y en la misma dirección. Si la curva r es regular pero no está contenida en un plano, para describirla es necesario asignar a cada punto dos curvaturas. Para hacer esto se introduce el concepto de plano osculador, que contiene a la recta tangente y a una recta normal denominada normal principal, que se ubica en la dirección en la que varía la recta tangente en un entorno del punto. Se define la curvatura de flexión K como una medida siempre positiva, respecto de la longitud de arco correspondiente, de la rapidez con que la proyección de la curva r sobre el plano osculador se aparta de la tangente. La dirección del plano osculador en el espacio viene determinada por su correspondiente recta normal. Esta recta, cuando se refiere al punto de la curva considerado, se denomina recta binormal, E 1 E 2 123

124 reservándose el uso de recta normal principal para la recta N contenida en el plano osculador (Figura 9.3). La otra curvatura, denominada curvatura de torsión T, se define como una medida, también respecto de la longitud de arco, de la rapidez con que varía la dirección de los planos osculadores en puntos de la curva próximos al considerado. La curvatura de flexión es la curvatura de la curva plana obtenida proyectando los puntos de la curva r sobre el plano osculador. La curvatura de torsión, como su nombre lo indica, mide la torsión, es decir el apartamiento local de r respecto de una curva plana. La curvatura de torsión de una curva plana es cero en todos sus puntos. Consideremos una curva cualquiera contenida en la superficie y que pase por un punto P en el que se quiere estudiar la curvatura. El plano osculador a la curva en el punto P por lo general es oblicuo. La intersección de ese plano con la superficie determina una sección plana cuya curvatura es en valor absoluto igual a la curvatura de flexión de la curva en P. Así pues, si conocemos las curvaturas principales 1 1 y 1 2 en un punto de una superficie, la curvatura de flexión de cualquier curva en la superficie en ese punto queda determinada por la dirección de su tangente y por el ángulo entre su plano osculador y la normal a la superficie en el punto. Como la curvatura de torsión es independiente de la curvatura de flexión, debe determinarse en forma independiente. Gauss mostró que es posible definir la curvatura de una superficie en un punto desde un punto de vista diferente al que reduce la cuestión a hallar las curvaturas de las secciones normales por ese punto. Partió de la definición de curvatura para una curva plana. Como a cada recta tangente le corresponde una recta normal, puede decirse también que la curvatura de una curva plana mide la rapidez de variación de dirección de las rectas normales al pasar de un 124

125 punto a otro próximo, o dicho de otra forma, mide la divergencia local de las normales a la curva plana. Supongamos que en el plano de la curva se construye una circunferencia con radio unidad. Entonces a cada punto de la curva le corresponde un punto en la circunferencia, precisamente el extremo del radio que es paralelo a la recta normal al punto de la curva considerado. Al ángulo entre dos normales le corresponde un arco de circunferencia cuya longitud es igual a ese ángulo. La curvatura es el límite del cociente entre la longitud del arco de circunferencia y la longitud del arco de curva correspondiente, cuando esta ultima longitud tiende a cero de forma tal que un mismo punto de la curva pertenece a todos esos arcos (precisamente el punto en el cual se calcula la curvatura). Ahora supongamos que tenemos una superficie E regular y bilátera en E 3. Consideremos un punto fijo P perteneciente a esa superficie, y una porción AE de superficie que incluye a P en su interior. Las dimensiones de AE se tomarán tan pequeñas como pudiera ser conveniente, siempre con el punto P en su interior. Construimos una esfera E de radio unidad y centro O. Trazamos por el punto O rectas paralelas a las normales a la superficie en cada uno de los puntos de una porción de superficie AE. Entonces a cada punto de AE le corresponde un punto en la superficie esférica perteneciente a un casquete AE. Obtenemos así una representación esférica de un elemento de superficie. Debemos distinguir entre los dos lados de la superficie, elegir uno de ellos y orientar las rectas normales en consecuencia. Como las normales a la superficie en puntos distintos podrían ser paralelas, algunas porciones de esfera se podrían superponer aún proviniendo de porciones disjuntas de la superficie. Pero si seleccionamos porciones de superficie lo bastante pequeñas, esta superposición no ocurrirá. Se selecciona AE de modo que su frontera es un arco de curva cerrada simple C en E. La frontera de AE es un arco de curva cerrada simple C o en E que constituye una imagen esférica de C. Si orientamos el contorno C en uno de los dos sentidos posibles, el sentido del contorno C o queda determinado. Si su sentido es el mismo que el sentido de C, al área AA de AE y al área Afí de su imagen esférica AE se les asigna el mismo signo. Esto ocurre cuando el punto P es elíptico. Si el sentido de C o resulta el opuesto al de C, al área Afí se le asigna diferente signo que el asignado al área AA. Esto ocurre cuando el punto P es hiperbólico. Si se toma el límite del cociente Afí, cuando AA tiende a cero de tal modo que el AA punto P en el que se quiere definir la curvatura pertenezca a todos los elementos de superficie utilizados para calcular el límite, se obtiene la curvatura de Gauss en ese La curvatura > mide la divergencia local de las normales a la superficie. 125

126 Esta medida de la curvatura verifica: K = k, - k 2 =± 1 2 E E Además, es una propiedad intrínseca de la superficie 106 : no varía al deformarla sin dilatación ni corte. Por este motivo a la curvatura de Gauss también se la denomina curvatura intrínseca. Es una medida de la diferencia entre la geometría intrínseca de la superficie y la geometría plana Resumen de algunos resultados sobre geometrías intrínsecas de superficies en E 3. La consideración del quinto postulado de Euclides (por un punto exterior a una recta dada pasa una y solo una recta paralela a la primera) y la distinción entre geometría como construcción matemática y geometría como modelo del espacio físico, condujo al desarrollo de las geometrías no euclidianas. Al comienzo de este proceso, Legendre obtuvo un resultado muy importante: demostró que el quinto postulado equivale al teorema que afirma que la suma de los ángulos de un triángulo es igual a n. Hacia 1816, Gauss ya se había convencido acerca de la imposibilidad de demostrar el quinto postulado, y se encontraba desarrollando la teoría de las superficies embebidas en el espacio euclidiano tridimensional, con ayuda del cálculo infinitesimal. Caracterizaba las coordenadas cartesianas de los puntos de una superficie 105 mediante funciones del tipo x = x(u,v) y = y(u,v) z = z(u,v), donde el par ordenado (u,v) formado por las variables independientes se pueden interpretar como un punto de una región adecuada en un plano euclidiano. Se denominan parámetros de la representación de la superficie. Una curva en el espacio se puede caracterizar por funciones del tipo x = x(u) y = y(u) z = z(u). En particular, si en las funciones que determinan los puntos de una superficie se fija un de las variables independientes, haciendo por ejemplo v = v 0, se obtiene una curva cuyos puntos se encuentran contenidos en la superficie x = x(u, v 0 ) y = y(u, v 0 ) z = z(u,v 0 ) Una curvas correspondiente a un valor constante de uno de los parámetros se conoce como línea de coordenada o curva coordenada. En forma análoga se puede fijar la otra variable independiente, o definir una relación entre ambas variable, determinando así otras tantas curvas incluidas en la superficie. Se puede construir entonces una red de curvas que cubren toda la superficie y se intersecan entre sí (no siendo en general recto el ángulo definido por la intersección: no son necesariamente familias de curvas ortogonales). 105 Si la superficie es esférica y su radio es E 0, resulta que K = es positiva y constante. E La otra curvatura local empleada en la teoría de superficies, la curvatura media o curvatura de Germain, es una propiedad de la geometría extrínseca de la superficie, es decir depende de cómo la superficie se encuentra inmersa en el espacio tridimensional. Ver

127 El elemento de línea ds 2 = d* 2 + dy 2 + dz 2 que mide la separación de dos puntos en el espacio euclidiano se puede aplicar a dos puntos de la superficie: ds 2 = dr(w,v ) 2 + dy(w, v ) 2 + dz (w, v ) 2 Para dos puntos vecinos Gauss dedujo la expresión del elemento de longitud en función de las coordenadas (w, v) (en se puede hallar una deducción): ds 2 = E(w, v)- dw (w, v)- dw dv + 5(w, v)- dv 2 Aquí w y v son los parámetros de la red de curvas o líneas de coordenadas contenidas en la superficie y tales que por cada punto pasan en general dos de estas curvas. Ahora bien, la geometría en el plano euclidiano se reduce a estudiar propiedades de líneas y figuras sobre la base de las distancias entre sus puntos. Gauss de dio cuenta que si se conocían E,3 y 5 como funciones de w y v era posible construir una geometría en la superficie. Para hacerlo se basó en la posibilidad de caracterizar algunos elementos geométricos básicos, como las líneas rectas y los ángulos de la geometría de Euclides en el plano, de tal manera que sea factible identificar los elementos correspondientes en una superficie cualquiera. Las líneas rectas, y solamente ellas, son las curvas de longitud mínima que pasan por dos puntos dados del plano o del espacio euclidiano. En una superficie pueden definirse entonces curvas equivalentes a las rectas del espacio euclidiano como las líneas de menor longitud que unen dos puntos dados: las líneas geodésicas. Dados tres puntos en una superficie, no pertenecientes a la misma línea geodésica, se construyen las líneas geodésicas que los unen y queda definido el equivalente de un triángulo. Por cada vértice del triángulo pasan dos geodésicas, y las tangentes a esas geodésicas en dicho vértice determinan el correspondiente ángulo del triángulo. En el caso de una superficie esférica, si a,[,y son los ángulos de un triángulo contenido en la superficie, si a es el área de ese triángulo, y si > es la medida (intrínseca) de la curvatura introducida por Gauss se tiene io? : a + [ + y-n = a(> + ) donde tiende a cero cuando el triángulo se contrae hacia un punto de la superficie y su área tiende a cero. Entonces, cuanto menor es ese triángulo, más próxima a n se encuentra la suma de sus tres ángulos. En ese sentido, la geometría en una superficie esférica es, localmente, una geometría euclidiana plana. Reordenando la fórmula para la suma de los ángulos de un triángulo se obtiene una. a + [ + r-n,,, fórmula para la curvatura de Gauss: > = (como > = a se ve que la curvatura local radio de la esferae o = s e puede estimar sumando los ángulos Eo 2 V> de un triángulo, restando n y dividiendo el resultado por el área del triángulo, siendo la estimación tanto más aproximada cuanto más pequeño se tome el triángulo, puesto que tiende a cero con esa área. Pero Gauss fue aún más lejos. Comprendió que la geometría bidimensional que se podía construir a partir del elemento de línea ds 2 = E dw dw dv + 5 dv 2 era una lo7 Este es un caso particular de un teorema que se verá en

128 propiedad intrínseca de la superficie, independiente del hecho de que estuviera embebida en el espacio euclidiano. La geometría permanecería invariante si la superficie embebida era deformada de tal manera que se conservaran todas las distancias entre puntos medidas por las longitudes del arco de geodésica que los une. Diciéndolo en forma intuitiva, se conservarían las relaciones geométricas si se deformaba la superficie en el espacio sin estirarla ni cortarla. Un modelo físico de esta transformación que conserva las propiedades geométricas intrínsecas se puede construir a partir de una hoja plana de estaño muy delgada, doblándola para formar un cilindro o en general deformándola sin dilatarla ni desgarrarla. Un segmento de recta de la hoja plana, que une dos puntos próximos, se transforma en un segmento de curva geodésica que une esos mismos puntos en la superficie resultante de la deformación. Puesto que para demostrar los teoremas de la geometría euclidiana plana no es necesario hacer referencia al espacio tridimensional, todos esos teoremas pertenecen a la geometría intrínseca de cualquier superficie que se pueda obtener del plano por deformación sin estiramiento ni corte. La relación a + j3 + y-n = a(k + e) entre la suma de los ángulos de un pequeño triángulo formado por líneas geodésicas, su área a, y la curvatura de Gauss K en un punto P de la superficie situado en el interior del triángulo (de modo que tiende a cero cuando el triángulo se contrae hacia el punto P y su área tiende a cero) no solo es aplicable al caso de una esfera, sino que se aplica a cualquier superficie regular. ^ Reordenado esta fórmula se obtiene: K = a+b+y-n a La curvatura de Gauss es una medida de la diferencia entre la suma de los ángulos de un triángulo en el plano y en la superficie, triángulo cuyos lados en ambos casos se construyen a partir de líneas geodésicas. La Figura 9.4 muestra un triángulo de ese tipo construido en una superficie con curvatura de Gauss negativa. Figura 9.4 Superficie en forma de silla de montar (paraboloide hiperbólico) en la que se ha dibujado un triángulo comprendido entre líneas geodésicas. En la parte inferior derecha se puede ver el esbozo de dos arcos de curva y un arco de geodésica que corta ambos arcos en ángulo recto. En la geometría intrínseca de esa superficie son arcos de dos curvas paralelas. Otra fórmula de la geometría intrínseca de una superficie que también presenta mucho interés, es la relación entre la longitud de una circunferencia y su radio. Ubicamos el centro de un pequeño círculo en el punto P de una superficie. Para ello definimos una 128

129 circunferencia como la curva formada los puntos de la superficie que equidistan de P en este sentido: cada punto de esa curva (circunferencia) se encuentra en una línea geodésica que pasa por P y las longitudes de los correspondientes arcos de geodésica son todos iguales a un número r que por definición es el radio de la circunferencia. n! Si l es la longitud de la circunferencia, se verifica: lc = 2n- r K - r + c En esta fórmula K es la curvatura de Gauss K en el punto P (el centro del círculo) y c tiende a cero (cuando r tiende a cero) más rápido que r3. La curvatura de Gauss mide en este caso la diferencia entre la longitud de una circunferencia construida en la superficie a partir de arcos de geodésica de longitud r que parten de un centro P, y la expresión 2 n - r correspondiente a la longitud de una circunferencia en la geometría euclidiana. TT De ambas fórmulas, a + j3 + y-n = a(k + ) y l = 2n-r --3-K -r3 + c, se desprende que cuando las dimensiones de la figura (triángulo o circunferencia) tienden a cero, las propiedades geométricas intrínsecas a la superficie tienden a las de las figuras correspondientes de la geometría p a n a. La curvatura de Gauss permite dividir las superficies en clases de equivalencia. En cada clase se encuentran las superficies que se pueden transformar la una en la otra por deformación que conserva las propiedades métricas. La clase con curvatura de Gauss nula incluye al plano pero no incluye esferas. La clase con curvatura de Gauss positiva K incluye la esfera de radio R0 = - L, puesto vk que en el caso de una esfera en todos los puntos los radios principales de curvatura son iguales al radio de la esfera. Pero esta clase, que incluye la esfera de radio R 0 = - L, VK no incluye esferas de distinto radio, porque tienen curvaturas de Gauss diferentes: las geometrías intrínsecas de esferas de distinto radio no son las mismas. Así, la suma de los ángulos de triángulos formados por geodésicas (que en el caso de la esfera son arcos de circunferencia de círculos cuyo centro es el centro de la esfera) y de áreas iguales, varía con el radio de la esfera. Lo mismo ocurre en la clase que presenta superficies con curvatura de Gauss negativa. Un ejemplo de superficie que presenta curvaturas de Gauss negativas es el hiperboloide de una hoja que se muestra en la Figura 9.5. Figura 9.5 Ejemplos de superficies con curvaturas de Gauss negativas (hiperboloide de una hoja), nulas (cilindro) y positivas (esfera). 129

130 Como Gauss había llegado a la conclusión de que el postulado de las paralelas no podía ser demostrado, como sabía que era equivalente al teorema de que la suma de los ángulos de un triángulo es igual a n, y había adquirido una gran experiencia en lo concerniente a la "geometría bidimensional" de una superficie esférica, Gauss se preguntó si nuestro espacio físico tridimensional sería realmente plano, euclidiano, o si como la superficie de una esfera, estaría curvado^8. Eligió los picos de tres montañas en el centro de Alemania (el Inselbeg, el Brocken y el Hoher Hagen) en cuya cima colocó espejos. Supuso que un rayo de luz sería en todo caso una línea geodésica, y utilizó rayos de luz reflejados para formar un triángulo. A menos de un inevitable error experimental, concluyó que los resultados confirmaban que nuestro espacio es plano io >. Antes de pasar a considerar, en las secciones 9.4 y 9.5, los espacios de n dimensiones y sus correspondientes geometrías, y con el propósito de comprender mejor el camino intelectual que condujo de la teoría restringida a la teoría generalizada de la relatividad, nos detendremos para analizar brevemente dos ejemplos planteados en términos de conceptos de física clásica. 9.2 Curvatura o fuerza? Resulta interesante analizar un poco más el ejemplo de una superficie esférica para ver cómo durante un movimiento restringido a esa superficie puede aparecer un fenómeno que, admitiendo la validez de la geometría euclidiana, se puede interpretar como debido a una fuerza, aunque en realidad resulta una consecuencia de la curvatura del espacio donde se produce el movimiento. Para ello vamos a considerar un navegante en un barco, que se propone rodear una isla recorriendo los bordes de un triángulo equilátero. Supongamos que el navegante ignora la curvatura de la Tierra, y supone la validez de la geometría euclidiana plana. Entonces avanza, siguiendo una geodésica (que él interpreta como un segmento de recta euclidiana), una longitud igual a la del lado del triángulo, cambia de dirección haciendo un ángulo de 6o 0, vuelve a navegar la misma distancia, cambia nuevamente de dirección 6o 0, y cuando ejecuta el tramo final, se encuentra con que no termina en el punto inicial, sino en un punto interior al segmento correspondiente al primer lado del triángulo que intentaba realizar. Todo ocurre como si la isla lo hubiera atraído hacia ella. El navegante podría suponer que esa fuerza de atracción actúa sobre el barco mientras éste recorre un lado del triángulo, de modo que para compensarla y así vencerla es necesario aumentar el ángulo con respecto a los 6oo cada vez que cambia de dirección. 108 Este planteamiento se relaciona con uno muy anterior de Eratóstenes, que en una época en la cual la mayoría de las personas pensaban que la Tierra era plana, se planteó la posibilidad de que fuera esférica y diseñó un experimento, que resultó exitoso, para determinar su radio. Ahora sabemos que hubiera detectado una desviación de n inferior a lo^. En 1964, I. Shapiro midió el retardo en el eco del radar entre la Tierra y sondas espaciales ubicadas en Mercurio, Venus y Marte. Cuando el planeta con la sonda se encuentra del lado opuesto de la tierra respecto del Sol, el retardo debe aumentar respecto de lo que cabría esperar si el espacio fuera euclidiano. La mecánica celeste permite calcular las distancias euclidianas (las órbitas) con gran precisión. Sobre todo esto puede verse el libro de H. Stefani "Gewera/ re/aí/'v/'/y", Cambridge University Press, Cambridge, UK,

131 A partir de esta idea puede investigar el presunto campo de fuerzas asociado con la isla, encontrando que la fuerza aumenta proporcionalmente al área del triángulo, o sea aproximadamente con el cuadrado de la distancia. En este caso sabemos que la interpretación que corresponde a la realidad es muy otra: basta considerar la curvatura de la superficie de la Tierra. Comenzando con la fórmula para la suma de los ángulos de un triángulo esférico, se obtiene en el caso de un triángulo equilátero, para el ángulo entre dos lados: a = ~n + (> + ) Se ve que es mayor que 6oo, porque la curvatura de Gauss de una esfera > = es E o positiva. Este es el ángulo que el navegante debería haber establecido entre las navegaciones a lo largo de tramos de geodésicas de igual longitud, para que al final el triángulo se cerrara en el punto inicial. La aparente atracción de la isla es un efecto de la geometría no euclidiana bidimensional que se aplica en este caso a la superficie de una esfera de radio E o. 9.3 Movimiento libre de una partícula newtoniana en una superficie Supongamos ahora que una partícula se mueve en una superficie regular trazando una curva en esa superficie. Si el movimiento es por lo demás libre, la única fuerza que actúa sobre la partícula la ejerce la superficie para mantenerla allí. Entonces en la expresión de la segunda ley de Newton m - a = 3, restricción debe ser en cada punto perpendicular a la superficie: 3 = 3 - n z el vector unitario normal a la superficie en el punto considerado). la fuerza de (aquí n z es Por su parte, la aceleración a de la partícula se puede descomponer en una componente según el vector unitario t r tangente a la curva r sobre la que se produce el movimiento (componente tangencial de la aceleración) y una componente según el vector unitario n r conocido como normal principal a la mencionada curva (componente normal de la 1 r \ 11o dv 2 aceleración) : a = í r + v -K- n r dt En esta fórmula v es la magnitud de la velocidad de la partícula y Kes la curvatura de flexión de la curva. Como consecuencia de esta descomposición y de la dirección de la fuerza de restricción la segunda ley se puede escribir así: m - - r + m - v 2 - K- n r = 3 - n z dt Como el vector tangente a la curva se halla en el plano tangente a la superficie en el punto considerado, se tiene que el producto escalar f r n z = o Multiplicando escalarmente ambos miembros de la expresión de la segunda ley por n z resulta: m - v 2 - K - (n r n z ) = 3 11CI Ver, por ejemplo, el de J. Roederer "Mecán/'ca e/ementa/", 2 edición, EUDEBA, Buenos Aires, 2oo2. 131

132 Pero como el vector tangente y el vector normal principal son perpendiculares en un mismo punto de la curva, multiplicando ambos miembros de la fórmula de la segunda ley por ñ r se obtiene: m - v 2 - K = F - (ñ r ñ L ) De estas dos últimas ecuaciones se desprende que siempre que (ñ r ñ L ) 2 = 1 Esta igualdad implica (ñ r ñ L ) = ±1 K ^ 0 entonces Puesto que se trata de vectores unitarios, si suponemos que ñ r apunta hacia el lado cóncavo de la curva (y de la superficie) mientras que ñ z apunta en dirección opuesta, resulta que en cada punto de la curva trazada por la partícula en la superficie: ñ r = -ñ L En caso contrario, ñ r = ñ z Si se da uno de estos casos en un punto de la curva, se da en todos los puntos lo bastante próximos. Como consecuencia de esta igualdad se deduce que m - -? r - m - v 2 - K-ñ z = F - ñ z lo dt dv cual implica a su vez que = 0 en todos los puntos de la curva: la magnitud de la dt velocidad se mantiene constante durante el movimiento. Por otra parte, resulta que la única componente de la aceleración que en general no se anula, la aceleración normal v 2 (v 2 ) por la curvatura en el punto considerado. - K, es el producto de una constante del movimiento Entonces depende solamente de una propiedad geométrica de la curva que traza la partícula en la superficie durante su movimiento: su curvatura de flexión. Más aún, la igualdad ñ r = ±ñ z en cada punto de la curva tiene otra consecuencia notable: la curva en cuestión es una geodésica de la superficie. Para hallar el arco de longitud mínima o en general extrema (el arco de geodésica) que une dos puntos de una superficie se aplica el cálculo de variaciones a la expresión de la longitud de un arco de curva que une esos dos puntos y está restringido a permanecer en esa superficie. Se obtiene un sistema de ecuaciones diferenciales ordinarias 111 cuyas soluciones son las curvas geodésicas correspondientes a la superficie considerada. Se demuestra que esas ecuaciones equivalen a la propiedad geométrica siguiente: los planos osculadores (planos que contienen el vector tangente y el vector normal principal a una curva) en cada punto de una geodésica son ortogonales al plano tangente a la superficie en ese mismo punto (es decir, el vector normal a la superficie en un punto está contenido en el plano osculador que pasa por ese mismo punto). Como esta propiedad geométrica a su vez equivale a la igualdad ñ r = ±ñ L que obtuvimos a partir del estudio del movimiento, entonces una curva en cuyos puntos se verifique esta igualdad es una geodésica. Por ende depende solo de la superficie y es independiente de la masa de la partícula. 111 En el capítulo 7 del volumen 2 del libro de R. Courant "Differential and integral calculus", Interscience, New York, 1961, se puede hallar una introducción al cálculo de variaciones junto con su aplicación a la determinación de las geodésicas en una superficie en el espacio euclidiano y la interpretación geométrica de las ecuaciones diferenciales obtenidas. 132

133 2 3 Ahora bien = -v - K. La magnitud de la velocidad viene determinada solo por su m magnitud inicial, y la curvatura K depende solo del punto de la superficie considerado, puesto que es la curvatura de la línea geodésica que pasa por ese punto. Por tanto el 3 cociente no depende de la masa de la partícula: la fuerza de restricción es siempre m proporcional a la masa y la aceleración en cada punto de la superficie, en forma análoga a lo que ocurre con el campo gravitatorio, es independiente de la masa de la partícula cuyo movimiento se considera. Este ejemplo y sus generalizaciones, bien conocidos por los matemáticos y por la mayoría de los físicos a partir del último cuarto del siglo XIX, junto con la exitosa descripción del movimiento en el espacio tetradimensional de Minkowski que se lleva a cabo en la teoría restringida de la relatividad, sugieren la posibilidad de abordar los fenómenos de la gravitación desde la perspectiva de un movimiento libre en un espacio abstracto curvo. En este caso cabe esperar que el tiempo, medido con respecto a un marco de referencia, ya no sea un parámetro, como en la mecánica clásica, sino que se integre junto con las variables espaciales en las coordenadas que representan los puntos de ese espacio abstracto. 9.4 Espacios abstractos y variedades de Riemann Para formular la teoría generalizada de la relatividad es necesario, entonces, recurrir a los espacios abstractos. Riemann, en su famosa disertación para la habilitación como Profesor, que menciona Bell en la cita que da comienzo de este capítulo, mostró cómo estos espacios permiten generalizar la teoría de Gauss a continuos de más de dos dimensiones. Posteriormente, algunas de las ideas que Riemann planteó se desarrollaron dando origen al cálculo tensorial, particularmente en los trabajos de Ricci y de Levi- Civitá. En esta parte se resumen algunos elementos de la teoría de espacios abstractos con el propósito de facilitar la presentación esquemática de los campos de tensores definidos sobre variedades y de la curvatura de esas variedades, que se considera en la parte 9.5. En conjunto ambas partes están destinadas a suministrar un mínimo de herramientas matemáticas para poder discutir los fundamentos de la teoría einsteniana de la gravitación en el marco del presente trabajo. La presentación no es rigurosa desde el punto de vista matemático (ni pretende serlo), pero se sitúa en un nivel de abstracción más elevado que el de las partes precedentes de este mismo capítulo Resumen del aparato analítico de la geometría diferencial clásica. Esta sub-sección intenta resumir algunas de las ideas de Gauss y otros autores de trabajos matemáticos también clásicos del siglo XIX, acerca de la teoría de superficies, en notación matemática y conceptos un poco más cercanos a los actuales. Introduciendo un sistema de coordenadas cartesianas ortogonales con origen en un punto de E3, los puntos del espacio se pueden representar mediante vectores de posición r = x - /' + y - j + z -1, donde /', j, 1 los son vectores unitarios ubicados sobre los ejes de coordenadas. 133

134 El producto escalar de dos vectores a = a x - i + a y - j + a z -1 y b = b x - i + b y - j + b z -1 puede escribirse a b = a x - b x + a y - b y + a z - b z La longitud lal de un vector se puede definir a partir del producto escalar: I al = V a a Si y es en ángulo, no mayor que n, entre los vectores a,b : a b = a La función vectorial regular de una variable r(t) = x(t)-1 + y(t)- j + z(t)-1 - cosy describe una curva r en E 3 con vector tangente ^ ^ = ^ ^ - j + - j + ^ ^ -1, elemento de arco dt dt dt dt ds 2 = ^ÍÚ. ^ÍÚ. - dt 2 y longitud del arco de curva comprendido entre los puntos AyB: dt dt s(r^ )= J Í M T M - dt v A^B> \ dt dt Cuando la longitud de arco se toma como parámetro, el vector tangente j j j - / \ dr (s) dx(s) dy(s) dz(s),..... t r (s) = = i + j + 1 posee longitud unidad. ds ds ds ds Como t r (s) t r (s) = 1 para todo s, derivando respecto de la longitud de arco se obtiene: j r(s ) ~ j r(s ) = 0 ds Entonces introduciendo un vector unitario ñ r (s) y un escalar (que por definición es no d - ( negativo) K(S) (la curvatura de flexión) se puede poner: f r (s) s ) = d 2 r(s) = K(S)- ñi r (s) ds r ds 2 El vector ñ r (s) permite definir una recta orientada, la normal principal a la curva en el punto considerado. Una superficie E en E 3 se puede determinar mediante la función vectorial regular de dos variables r (u, v) = x(u, v)- i + y(u, v)- j + z(u, v)-1 Si se conoce esta función, cada punto de la superficie se puede identificar mediante un par de valores (u,v) en el dominio D de la función vectorial. Dos funciones regulares u(t) y v(t) determinan una curva contenida en E cuyo vector,, dr(t) dr(u(t), v(t)) du(t) dr(u(t), v(t)) dv(t) tangente viene dado por ^ = v w ' ^ + v - ^, se encuentra dt du dt dv dt en el plano tangente a la superficie y define una recta orientada en ese plano. A la línea dr (u,v 0 ) coordenada v = v 0 con parámetro u le corresponde el vector tangente, du mientras que a la línea coordenada u = u 0 con parámetro v le corresponde el vector dr (u 0, v) _., dr (u,v) dr (u,v),... tangente 0. El producto vectorial X define la dirección y dv du dv sentido de la recta normal a la superficie en el punto (u,v), mientras que dr (u,v) x dr (u,v) du Ñ (u,v ) = d j (u,v ) x a j (u,v) X du dv X dv superficie en ese punto. es el vector unitario (versor) ortogonal al plano tangente a la 134

135 , (ds(t) 1 dr (t) dr(t) El cuadrado de la derivada del elemento de arco I I = se puede ^ dt j dt dt escribir así: 2 = E. M l Ml.. 3. M ). M ) + G. dt j dt dt dt dt dt dt dv(t) dv(t) E( w v )=dr ( w,v ) t d^q/,v ) 3/ v)=dr ( w, v ) ^ dr ( w,v ) G( W v )=drtw,v ) ^ 3r ( w, v ) dw dw dw dv dv dv ^ Teniendo j en cuenta x que dr j- = dr (w, v) dw ^ I dr (w, v) dv : dw dv ds 2 = dr dr = E(w, v). dw (w, v). dw dv + G(w, v) dv 2 Esta es la denominada primera forma diferencial de la teoría de superficies. La longitud de un arco de curva contenido en una superficie y que une dos puntos AyB de la misma, se puede hallar empleando la primera forma diferencial: dw(t) dw(t) dw(t) dv(t) s(y ) = í l E i2 3 I G dv(t) dv(t). dt B> dt dt dt dt dt dt M A partir de esta ecuación se puede plantear y resolver el problema de hallar las curvas de longitud mínima, es decir las curvas geodésicas contenidas en la superficie, como se verá en detalle en 9.5. La segunda forma diferencial se introduce durante el estudio de cómo la superficie se encuentra inmersa en la región del espacio E3 que la rodea, es decir, el estudio de su curvatura. La desviación de la superficie respecto de su plano tangente en un punto (w 0, v 0 ) se puede caracterizar mediante la proyección del vector r (w, v)- r (w 0, v 0 ) sobre el versor normal '(wo, vo): &(w, v) = (r (w, v) - r (wo, vo )) '(w0, vo) (Figura 9.6) Figura 9.6 Pero si ponemos AM = M - M 0 y Av = v - v 0 el incremento vectorial se puede expresar mediante un desarrollo de Taylor en un entorno del punto (w 0, v 0 ): 135

136 r(u, v) - r(u 0, v 0 ) = dr(u 0, v 0 ; Au, Av) d 2 r(u 0, v 0 ; Au, Av) + o(au 2 + Av 2 ) Como consecuencia la distancia entre un punto de la superficie y el plano tangente en (u 0, v 0 ) se puede formular así, teniendo en cuenta que Ñ(u 0, v 0 ) dr (u 0, v 0 ; Au, Av) = 0 : &(u, v) = 2 - Ñ (u 0, v 0 ) d 2 j (u 0, v 0 ; Au, Av) + o(au 2 + Av 2 ) - d 2 j Introduciendo los coeficientes e(u 0, v 0 ) = Ñ(u 0, v 0 ) - (u 0, v 0 ) du f (u 0, v 0 ) = Ñ(u 0, v 0 (u 0, v 0 ) g ( u 0, v 0 ) = Ñ ( u o, v 0 dudv dv (u 0, v 0 ) 2 - h(u,v ) = e(u 0, v 0 )- Au f (u 0, v 0 )-Au -Av + g (u 0, v 0 )-Av 2 + o(au 2 +Av 2 ) La curvatura de la sección normal de la superficie en la dirección determinada por los incrementos Au = u - u 0 y Av = v- v 0 cuando se fija el cociente X =, se puede Au 2 - h calcular como 1 Ñ = lim donde l es la distancia en el plano tangente entre la proyección del punto de coordenadas (u,v) y el punto de coordenadas (u 0, v 0 ). Resulta: (X) = e(u 0, v 0 )- ^ /(u0, v0)- ^ - ^ ^ + g(u0, v0)- ^^^ Teniendo en cuenta la primera forma fundamental esta relación se puede re-escribir: e(u 0, v 0 )- du f (u 0, v 0 )- du - dv + g(u 0, v 0 )- dv 2 k = E(u0, v 0 )- du F(u 0, v 0 )- du - dv + G(u 0, v 0 )- dv La expresión e(u 0,v 0 )-du f (u 0,v 0 )-du - dv + g(u 0,v 0 )-dv 2 se conoce como la segunda forma diferencial de la teoría de superficies. ^,, /.x e(u, v 0 ) f (u 0, v 0 )-A + g(u 0, v 0 )-A 2 En función de la dirección 1: 1 Ñ (X) = ) 0 J v oj ' % ^ s \ 0 ' - E (uc v0) F (u 0, v0 )X + G(u 0, v0 )X Calculando la derivada respecto de X de la curvatura normal e igualándola a cero se puede hallar una ecuación cuya solución permite hallar los valores extremos y 1 2 de 1 Ñ (X) junto con las direcciones principales en las que estos valores extremos son alcanzados. 112 Después de algunos cálculos, se obtiene finalmente esta ecuación de segundo grado: (E - G - F 2 )- 1 Ñ 2 (X)-(e - G + g - E f - F)- 1 Ñ (X) + (e - g - f 2 ) = 0 El producto de las raíces de esta ecuación es la curvatura de Gauss, intrínseca o total: K = -1 2 = e - g - f E - G - F 2 La suma de las raíces es el doble de la curvatura media o de Germain H = e - G + g - E 2 - f - F en el punto de la superficie considerado. E - G - F Que se pueden encontrar en el libro de D. Struik "Geometría diferencial clásica", pp y 94-95, Aguilar, Madrid,

137 Finalmente, como preparación para el estudio de las geometrías en las variedades, consideremos la teoría de superficies desde un punto de vista algo diferente, debido fundamentalmente a Gauss. La recta tangente orientada en cada punto de una curva regular contenida en una superficie determina en el plano tangente una dirección en ese punto. Esta recta junto con otra recta por ese mismo punto, tangente a la superficie y no paralela a la anterior determinan un plano tangente. A su vez ese plano tangente se puede considerar en sí mismo como un espacio euclidiano E2, es decir, como una variedad lineal 2 2 (w 0, v 0 ) asignada al punto (w 0,v 0 ) de la superficie. Como veremos a continuación es posible introducir todas las propiedades métricas que caracterizan la geometría en esa variedad utilizando la primera forma diferencial de la teoría de superficies, sin necesidad de recurrir al espacio E 3. Por supuesto, la variedad lineal 2 2 (w 0, v 0 ), cuando el panorama se contempla desde E 3, no es otra cosa que el plano tangente a la superficie en el punto. En general una dirección en una variedad lineal bidimensional 2 2 (w 0, v 0 ) asignada a un punto (w 0,v 0 ) de una superficie se puede caracterizar mediante un par ordenado (a u, a v ) de números, con al menos uno de ellos no nulo. Esos números se pueden interpretar como las componentes de un vector a respecto de los vectores tangentes a las líneas coordenadas en ese punto. A partir del elemento de línea Js 2 = (w 0,v 0 ) Jw 2 + 3(w 0,v 0 )-(Jw-Jv + Jv-Jw) + 5(w 0,v 0 ).Jv 2 en el punto (w 0, v 0 ) se puede definir una longitud a (la norma) del vector a : I -! 2 = ( Uq,vo ) -au ( w 0,v 0 ) - ( aw -av + av ^ ) + G ( w 0,v 0^2 > 0 Como esta desigualdad se verifica para todo a y en todo punto (w 0, v 0 ), debe verificarse 3(W Q, V Q )5(W Q, V Q )- 3 2 (M Q, V Q )> 0 en todos los puntos de la superficie. Añadiendo otra dirección b dada por sus componentes (b w, b v ) se puede definir un producto escalar en la variedad lineal 2 2 (u 0, v 0 ) en el punto (w 0, v 0 ): (a b ) E = (w o, V o )-a u - b u + 3(w 0, v 0 ) - ( a u - b v + a v - b u ) + 5(w o, v 0 ) - a v - b v En la definición del ángulo y entre a y b, no mayor que n, se emplea la fórmula: (a b L cos y = i-pipl Por definición, dos direcciones a y b en el punto (w 0, v 0 ) son ortogonales entre sí cuando: (a b ) E = 3(w o, Vq ) au -bu + 3 (Mq, Vq )-(au -bv + av-bu) + 5(w q, Vq -- = 0 Debe tenerse en cuenta que (a b ) z = a b y - = \a\ para todo vector a y b del plano tangente, cuando se los considera como los vectores de E 3 que son. Para ver esto, alcanza con constatar que (a b ) E se puede re-escribir así, teniendo en cuenta la expresión de 3,3,5 en términos de productos escalares en E 3 de las derivadas parciales de la función vectorial r (w, v) que define la superficie: ( a B = ( dr ( W o, Vq ) -au +dv ( w 0, Vq ) -A V (d l ( w q, Vq ) -bu + v ( w q, Vq ) -B V = a No obstante, lo importante es la posibilidad de definir una variedad lineal tangente en cada punto de la superficie (que como dijimos es el plano tangente, cuando se mira desde E 3 ) y un producto escalar en cada variedad lineal tangente, exclusivamente a 137

138 partir de la primera forma diferencial sin necesidad de recurrir a las propiedades del espacio euclidiano en el cual la superficie se halla embebida. Las direcciones que corresponden a las secciones normales principales son ortogonales en todos los puntos de la superficie. La dirección (l,0) del plano tangente en un punto de la superficie corresponde a la curva coordenada v = cte y la (0, l) corresponde a u = cte. Sustituyendo las componentes de esas direcciones en la expresión del producto escalar se obtiene para el valor de ese producto: 2 - F(u 0, v 0 ) Se deduce entonces que una condición necesaria y suficiente para que las direcciones de las líneas de coordenadas en un punto (u 0,v 0 ) sean ortogonales entre sí, es que se verifique: F(u 0, v 0 ) = 0 Consideremos un elemento de superficie delimitado por las líneas coordenadas que pasan por los puntos (u 0, v 0 ) (u 0 + Au, v 0 ) (u 0, v 0 + Av) (u 0 + Au, v 0 + Av). El área de este elemento se puede aproximar así: AA(u 0,v 0 ) = As u -As v -seny + o(au 2 +Av 2 ) En esta fórmula As u = -JE(u 0, v 0 ) - Au es la longitud de arco en la dirección (Au,0), As v = t] G(u 0, v 0 ) - Av es la longitud de arco en la dirección (0, Av) y yes el ángulo entre esas direcciones de las líneas de coordenadas que pasan por (u 0, v 0 ). F (u v ) Aplicando la fórmula ya vista resulta: cos y =. 0' \ -JE K, v0)- G(u 0, v0) Calculando el seno de y y sustituyendo en la expresión para el elemento de área resulta: AA(u 0, v0 ) = V E(u0, v0)-g(u 0, v0)- F 2 (u^ v0) - Au - Av + o(au 2 +Av 2 ) La expresión -^E(u 0, v 0 )- G(u 0,v 0 )- F 2 superficie en el plano tangente en el punto (u 0,v 0 ). (u 0, v 0 )-Au - Av es el área de un elemento de Como se estudia en detalle en los cursos de cálculo infinitesimal, sumando un conjunto apropiado de áreas como ésta se puede obtener una aproximación al área de una porción de superficie. En la medida en que el área A(E) de una superficie es el límite al que esas sumas, se puede hallar como una integral doble extendida al dominio D de variación de los parámetros de la superficie: A(z) = jjyle(u, v).g(u, v) - F 2 (u, v).du - dv D Si ds 2 = E 0 (u,v)- du F 0 (u,v)- du - dv + G 0 (u,v )dv 2 es el elemento de línea sobre una esfera, que constituye la tercera forma diferencial de la teoría de superficies, el elemento de área sobre la esfera viene dado por: A^(uc v0 ) = V E0 (uc v0)-g0 (u 0, v0)- F0 2 (u 0, v0) - Au - Av + O(AU 2 +Av 2 ) Si B es el dominio de variación de los parámetros, el área de un casquete esférico viene dada por: = jjyje 0 (u,v).g 0 (u,v)- F 0 2 (u, v).du - dv ^ B Estos resultados se pueden aplicar a una porción de superficie y a su representación 138

139 esférica vistas en como parte de la definición de la curvatura de Gauss, (considerada como una medida de la divergencia de las normales a la superficie en el entorno de un punto). En ese caso podemos utilizar un dominio 4 de parámetros común al elemento de superficie y a su representación esférica. Si contraemos el dominio en torno a un punto fijo (a,,vj, podemos calcular el valor absoluto de la curvatura intrínseca en el correspondiente punto de la superficie como el límite: n( )I _ (a,, v, ).G 0 (a,, v,) (a,, v,) > (M,, v,)= lim La definición de la A ( E ) J y E(a,, V,).G(M,, v,)-3 2 (a,, v,) curvatura de Gauss como producto de las curvaturas principales y la definición, que acabamos de ver, basada en una medida de la divergencia de las normales, son 113 equivalentes, debido a que se verifica : lim ( Q(y) 1 VE 2 0 (M, V).5 0 (M, V)- 3 0 (M, V) = e(w, v ) g (a, V ) - f 2 (a, v "^y = = = 1*1 1 2 VE(M, V).G(M, V )- 3 2 (A, V ) E ( M, V)G ( M, V ) M, V) ( Es posible demostrar que los coeficientes E 0 (a,v) 3 0 (a, v) G 0 (a, v) del elemento de línea sobre la esfera se pueden hallar a partir de las funciones E(M, V) 3(M,V) G(M, V) y de sus derivadas parciales hasta el segundo orden. Como consecuencia, la curvatura de Gauss se puede hallar a partir del elemento de línea de la superficie, sin necesidad de información adicional. Este resultado es teorema egregio de Gauss. En particular, cuando las líneas de coordenadas son ortogonales, la curvatura intrínseca se puede calcular en términos de los coeficientes E(M, V) y G(M, V) que no se anulan, mediante la fórmula siguiente 114. > = - VE-G da ' 1 VE avg' da + - d_ dv 1 ave i Una superficie con curvatura de Gauss variable, que inclusive cambia de signo al pasar de una porción de la superficie a otra, es geométricamente muy heterogénea porque como consecuencia de los cambios de curvatura las propiedades de su geometría 113 Esta igualdad queda demostrada si podemos probar esta otra: e(a, v)- g(a, V)- F 2 (a, V) = yje0 (a, v).g0 (M, v) (a, v) /E(M, V).G(M, V)-3 2 (a,v) Para ello se utilizan dos herramientas: -Una forma alternativa de escribir los coeficientes de la segunda forma diferencial de la teoría de superficies que se sustituye en la expresión e(a,v)-g(a,v)- f 2 (a,v), a saber: / s 3 ' (a, V) 3?,. > 1 e ( a v y = 5 ^ ( M ' V) / (a ' v) = da da VG d'(a, v) 9?/ \ d'(a, V) 9? / \ / \ d'(a, V) 9?/ \ 5 v y = E ^ ^ i a, v y g (M, V) = Sr^^"^ v ) da dv dv da dv dv -La identidad de Lagrange: X b ) (? X d)= ( 5??) ( i d) que se utiliza para deducir q u e e g - / 2 = i d ' X d ' j í.d? X.d?'l=(dv Xd' 9M dv II 9M 9M J I 9M dv d? d? X La igualdad entre las dos definiciones de la curvatura intrínseca se desprende entonces de las ecuaciones: d' da x9' dv r = + 9' 9' x da dv 9M = ±V E0 (a, v).g0 (M, V) (a, V) 9M ' dv D? Dr X Da Da = V E(a, V).G(M, V)-3 2 (a, V) 114 Ver el libro de D. Struik "Geometría diferencial clásica", pp , Aguilar, Madrid,

140 intrínseca se modifican de un punto a otro. Esta heterogeneidad hace que la geometría intrínseca en una superficie pueda diferir mucho de la geometría plana, pese a ciertas similitudes de índole general, como la correspondencia entre rectas y geodésicas, y entre ángulos determinados por la intersección de rectas y ángulos determinados por geodésicas que se intersecan. Supongamos que en una superficie formamos un triángulo delimitado por curvas geodésicas. El dominio de parámetros (u,v) del triángulo es un subdominio D Á del dominio D de la superficie. Mientras que en el plano la suma de los ángulos de un triángulo siempre es igual a la suma de dos ángulos rectos, en una superficie cualquiera la suma de los ángulos de un triángulo geodésico no está determinada a menos que conozcamos la curvatura de Gauss de la superficie. La suma de los ángulos se relaciona con la curvatura de Gauss de esta manera: a + P + y = n + jjk(u, v) - da(u, v), siendo da(u, v) = ^ E(u,v).G(u,v)- F 2 (u,v) - du - dv DA Si o es el área del triángulo y (u 0, v 0 ) es un punto interior al mismo, teniendo en cuenta que K(u,v) es una función regular, entonces jjk(u,v)- da(u,v) se puede aproximar por K (u 0, v 0 ) - o + o(o) de modo que resulta: a + /5 + y-n = o(k + ) En esta expresión o(o) = -o, y tiende a cero cuando o tiende a cero. Se obtiene así la fórmula utilizada en la discusión de la geometría intrínseca en la sub-sección DA Las ideas fundamentales de la geometría diferencial clásica fueron extendidas por Riemann y otros matemáticos, a partir de mediados del siglo XIX, sentando las bases de una teoría de los espacios abstractos de n dimensiones que constituye la herramienta matemática básica de la relatividad generalizada. El resto del presente capítulo se destina a estudiar esa teoría generalizada Espacios euclidianos de n dimensiones Eligiendo un origen O y un sistema de coordenadas cartesianas ortogonales se establece una correspondencia uno a uno entre puntos P y ternas ordenadas de números reales (x 1,x 2,x 3 ), o en forma equivalente entre vectores de posición OP y ternas (x 1,x 2, x 3 ). A cada vector OP le corresponde una terna y a cada terna un vector. En el conjunto de ternas se puede definir una adición de ternas, el producto de una terna por un escalar (número real) y el producto interno o escalar de dos ternas: (x 1, X 2, X 3 )+ (x\x 2, X 3 )= (x 1 + X 1, X 2 + X 2, X 3 + X 3 ) : -(x 1, x 2, x 3 )= (: - x 1,: - x 2,: - x 3 ) (x 1,X 2, X 3 ) (x \x 2,x 3 )= X 1 - X 1 + X 2 - X 2 + X 3 - X 3 partir del producto interno (x 1 - x\x 2 - x 2,x 3 - x 3 ) (JC 1 - x\x 2 - x 2,x 3 - x 3 ) se define la distancia euclidiana entre dos puntos *\ V[x (x 1 -x- x 1 ) 2 + (x 2 -x - x 2 ) 2 +( + (x 3 - x 3 ) 2 Entonces en el conjunto de las ternas ordenadas de números reales queda definida una estructura de espacio vectorial con producto interno y métrica inducida por ese producto 140

141 interno. A partir de esta estructura y de la correspondencia entre ternas y puntos, se puede desarrollar la geometría euclidiana tridimensional en forma enteramente analítica. Aunque no se la pueda visualizar mediante un modelo físico, esta representación se puede extender 115 para definir un espacio euclidiano de dimensión N representando los puntos del espacio mediante el conjunto de N-uplas ordenadas de números reales (x 1,x 2,...,x N ). Las x J constituyen las coordenadas respecto de cierto sistema de coordenadas cartesianas ortogonales, con la distancia entre puntos definida X (x 1 - x 1 ) 2 V I=1 a partir del producto interno: (x 1, x 2, x N ) (* 2,...,X N )= X-X 1 - XX 1 Esta distancia se puede expresar en forma infinitesimal mediante el cuadrado del elemento de distancia entre dos puntos (x 1,x 2,...,x N ) y (x 1 + dx 1,x 2 + dx 2,...,x N + dx N ): 1=N í \ ds 2 = X (dx 1 ) 1=1 En principio se debería poder utilizar cualquier sistema de coordenadas (no necesariamente coordenadas cartesianas ortogonales), que dejara invariante la expresión de ds 2 en cada punto del espacio. Un cambio de coordenadas regular, que conserve ds 2 pero por lo demás arbitrario, X 1 = f J (x 1,x 2,...x N ) para j=1, 2,..., N, en general conduce a una expresión del tipo ds 2 = X g' kdx"dx' 1 donde los N 2 coeficientes dependen en general de las coordenadas i, 1=1 (x' 1,x' 2,...,x' N ) pero se pueden tomar siempre simétricos: g' 1 = g' k i N 1=1 En consecuencia, solamente hay N ^ + 1) coeficientes independientes. Por ejemplo, para N=3, en coordenadas esféricas x' 1 = r,x' 2 = 6,x' 3 se tiene gn = 1,g22 = r 2,g3 3 = r2 - sen 2 d mientras que los demás coeficientes se anulan. Entonces: ds 2 = dr 2 + r 2 - d6 2 + r 2 - sen dq> 2 Pero lo característico de un espacio euclidiano generalizado es que siempre se pueden hallar cambios de coordenadas que permiten llevar el cuadrado de la distancia infinitesimal a la forma ds 2 2 1=N 1 2 = X (dx 1 ). El mismo sistema de coordenadas (denominado 1=1 sistema de coordenadas cartesianas ortogonales N-dimensional) permite expresar, para todos los puntos del espacio E N, el elemento de línea de esta forma particular, denominada forma diagonal. 115 Al igual que la correspondiente geometría N-dimensional. 141

142 Como un espacio euclidiano generalizado no está en principio referido a ningún otro, la geometría que se desarrolle en él puede considerarse una geometría intrínseca. En el caso de las superficies inmersas en el espacio euclidiano tridimensional, vimos en que es posible definir una geometría intrínseca para una superficie a partir del elemento de línea ds 2 = E da da dv + G dv 2. También vimos que la propiedad más notable de la curvatura de Gauss es que las superficies con diferentes curvaturas de Gauss son inherentemente distintas entre sí: si las deformamos de todas las maneras posibles, sin estirarlas ni romperlas, nunca podremos superponer una sobre otra. Entonces resulta natural generalizar estos resultados a espacios abstractos, denominados variedades, que son el equivalente n-dimensional de las superficies bidimensionales del espacio euclidiano de la geometría diferencial clásica Variedades riemannianas de n dimensiones Desde una perspectiva intuitiva se puede decir que una variedad n-dimensional es un conjunto de objetos P, denominados puntos, relacionados entre sí de tal forma que se asemeja localmente a una porción deformada de un espacio euclidiano n-dimensional 116. Esta semejanza permite representar los puntos de al menos una parte de la variedad mediante una n-upla de coordenadas pertenecientes a un espacio euclidiano. No obstante esta semejanza local, la estructura global de una variedad puede ser muy diferente de la de un espacio euclidiano. Por ejemplo, una superficie esférica, la superficie de un toro (un modelo matemático de una rosquilla) y la superficie de un cilindro infinito de sección circular son variedades bidimensionales formadas por puntos del espacio euclidiano tridimensional E 3. Si bien localmente, en la vecindad de cada uno de sus puntos, todas ellas se asemejan a una porción del plano euclidiano, vistas globalmente son muy diferentes. Una diferencia importante entre esas variedades es la siguiente: cualquier curva cerrada contenida en la superficie de una esfera se puede contraer hacia un punto sin abandonar Las variedades son un tipo especial de espacio topológico. A cada punto P de la variedad le corresponde en forma biunívoca (es decir, uno a uno) una n-upla (x 1,x 2,...,x") de números reales, cuyos componentes se denominan coordenadas del punto P. A la correspondencia Pv(x 1,x 2,...,x") entre puntos y n-uplas se la denomina sistema de coordenadas (o carta) definido en la variedad. En general se precisa más de una carta para representar la totalidad de los puntos de una variedad. Un conjunto de cartas adecuado forma un atlas de coordenadas. Si Pv(x' 1,x' 2,...,x'") es otro sistema de coordenadas, entonces hay una relación uno a uno entre las coordenadas de cada punto así representado: x' k = f k (x 1,x 2,...,x") x 1 = / 1 (x' 1,x' 2,...,x'") k,l = 1,2,...," La n-upla formada por las funciones f 1 constituye la función inversa de la n-upla formada por las funciones Supondremos que estas funciones son regulares (poseen derivadas parciales continuas de todos los órdenes). La variedad correspondiente se denomina variedad regular. Se pueden hallar definiciones concisas de estos y otros conceptos relacionados con las variedades (en inglés, manifolds) en el libro editado por Ema Previato "4/'c//o«ary ofap^l/'ed /or e«g/'«eers "d sc/e«//sís", CRC press, Boca Raton, USA,

143 la variedad, mientras que eso no es posible para ciertas curvas definidas en la superficie del toro y en la del cilindro. 117 Una variedad de Riemann n-dimensional V n es un conjunto de puntos representables mediante n-uplas ordenadas de números reales (x 1,x 2,...,x n ) tal que en cada punto se encuentra definido una forma cuadrática en términos de los diferenciales de las coordenadas: ds 2 = ZSÍ Z S kdx'dx k i, k=1 Esta forma debe permanecer invariante bajo los cambios de coordenadas que se puedan aplicar en la variedad. Riemann la interpretaba como una expresión del cuadrado de la distancia entre puntos de coordenadas (x 1, x 2,..., x n ) y (x 1 + dx 1, x 2 + dx 2,..., x n + dx n ) "infinitamente próximos", como se decía a mediados del siglo XIX. Los coeficientes s ik son funciones regulares de las coordenadas (x 1,x 2,...,x n ) con 118 excepción, quizás, de algunos puntos donde presentan singularidades. n Suponemos que Z S i k dx'dx k es o bien definida positiva (es decir es positiva excepto i, k=1 cuando todos los dx' son nulos, en cuyo caso se anula) o si no lo es, por lo menos el determinante de la matriz de coeficientes g(x\x 2,..., x n )= det \g tk (x\x 2,..., x n )]* 0 en todo punto de la variedad. n Si la forma diferencial ds 2 = Z g kdx'dx k es definida positiva, define una métrica en la i,k =1 variedad como la concebía Riemann. n Si la forma diferencial ds 2 = Z Si kdx'dx k no es definida positiva, entonces cambia de i, k=1 signo al variar los incrementos en las coordenadas y define una pseudo-métrica. Este último caso es el que interesa en el caso de la teoría de la relatividad. 117 Los contenidos de cálculo tensorial y geometrías de Riemann necesarios para comprender los fundamentos matemáticos, tanto la teoría de la gravitación de Einstein como sus principales aplicaciones cosmológicas, se pueden estudiar en el notable y didáctico libro de R. Lambourne "Relativity, gravitation and cosmology", co-editado por The Open University y por Cambridge University Press, Cambridge, U.K., Entre las muchas obras sobre tensores y sus aplicaciones a las geometrías de Riemann se tienen a nivel intermedio el libro de L. Santaló "Vectores y tensores con sus aplicaciones", EUDEBA, Buenos Aires, 1969, y el libro de A. Mc Connell "Applications of tensor analysis", Dover, New York, A nivel avanzado se tiene los libros de H. Weyl "Space, time, matter", Dover, New York, 1950; de J.L.Synge "Relativity: the general theory", North-Holland, Amsterdam, 1960; de T. Thomas "Tensor analysis and differential geometry", Academic Press, New York, 1965; de D.Lovelock y H.Rund "Tensors, differential forms and variational principles" Wiley, New York, 1975; y de S.Hasani "Mathematical Physics" Springer, New York, Los coeficientes g i k pueden no estar acotados en un entorno de uno de esos puntos, como ocurre en el caso de la métrica de Schwarzschild que se estudiará en el capítulo 11 y que constituye una de las pocas soluciones analíticas exactas que se conocen de las ecuaciones de la teoría de la gravitación de Einstein. 143

144 El espacio euclidiano (si el elemento de línea ds 2 es definido positivo) o pseudoeuclidiano (si ds 2 no es definido positivo) de n dimensiones, son los casos particulares más simples de una variedad n-dimensional. Se las denomina, respectivamente, variedades lineales euclidiana o pseudo-euclidiana Variedades lineales tangentes Además, las propiedades geométricas de una variedad en la vecindad de un punto de V n se aproximan tanto más a las de una variedad euclidiana o pseudo-euclidiana del mismo número de dimensiones cuanto menor sea el radio de esa vecindad. Se tiene así el denominado espacio tangente (o variedad lineal tangente) a la variedad de Riemann en ese punto. Se puede considerar como una generalización natural del concepto de plano tangente a una superficie bidimensional. Si (x 1,x 2,...,x") es un punto de V n, el espacio tangente a la variedad en ese punto es la variedad lineal (euclidiana o pseudoeuclidiana) E n (x 1,x 2,...,x") de n dimensiones cuyos puntos se representan mediante (y 1,y 2,...,y n ) (de modo que el punto (0,0,...,0) de la variedad tangente corresponde al punto (x 1,x 2,...,x") de V") y que posee la forma diferencial cuadrática asociada: d^ 22 " Í = ^ g, iv x, x \,..., x ') dy'dy 7,1=1 Esta forma define ya sea una métrica euclidiana, ya sea una pseudométrica euclidiana. Los coeficientes g ik (x 1,x 2,...,x") de una forma cuadrática se pueden considerar simétricos, de modo que se puede hallar un cambio lineal de coordenadas 119 en la variedad lineal tangente tal que en las nuevas coordenadas (z 1,z 2,...,z") el elemento de " línea se reduce a la forma diagonal ds 2 = dz/ donde cada l vale ± 1. El número =1 de coeficientes positivos p dentro del total de " coeficientes (en este caso el resto " - p de los son negativos) define la signatura a = p - (" - p) = p - " del elemento de línea en tanto forma cuadrática. Como los coeficientes g i1 (x 1,x 2,...,x") son funciones regulares de las coordenadas (x 1,x 2,...,x") del punto de la variedad V" considerado, las signaturas de las formas 120 cuadráticas son las mismas en cada uno de los puntos de la variedad. 119 Esto alude al bien conocido proceso de diagonalización de una forma cuadrática mediante transformaciones lineales de coordenadas. Las formas bilineales y los espacios pseudo-euclidianos se consideran en detalle en el capítulo 6 del libro de Máltsev "3w"dawe"fos de álgebra li"eal", Mir, Moscú, En el caso de la relatividad generalizada, la variedad de Riemann posee cuatro dimensiones. Además, como se verá en el próximo capítulo, se supone que esta variedad posee un elemento de línea que generaliza el intervalo del tiempo-espacio de Minkowski d 2 s = c 2 (di) 2 (dr) 2 (dy) 2 (d z ) 2 de tal forma que la variedad lineal tangente en cada punto es un espacio pseudo-euclidiano de Minkowski. Entonces la signatura del elemento de línea de la variedad de Riemann es la misma que la del intervalo de tiempo- espacio. 144

145 A partir de la forma cuadrática g,,(x\xx") y ^ / I,K=1 se puede construir una forma bilineal g i k (x 1, x 2,..., x" ) y 1 z k en la variedad lineal tangente. i, k' i, k=1 Introduciendo una base (e 13 e 2,...,e n ) se puede introducir un pseudo-producto escalar de " " dos vectores y = y' e i y z = z k Se ti e n e así: i=1 k=1 c n \ C n \ V i=1 J e k definiendo e i e k = g i k para i,k = 1,2,..., n k y z = y' e l z k e k = e t e k^y'z y z k = g t, k^y'- k gi,k y z -k V k=1 J i k=1 i k=1 A diferencia de un verdadero producto escalar, que verifica y y > 0 para todo y ^ 0 y se anula para y = 0, el pseudo-producto escalar no posee un signo definido y para algunos vectores se verifica y y = 0 siendo y ^ 0. producto escalar las demás propiedades básicas. No obstante comparte con el Por ejemplo, en el espacio lineal pseudo-euclidiano de Minkowski, a cada marco de referencia inercial le corresponde una base 121 (e 0, e 2, e 3 ) tal que e 0 e 0 = 1, e e = -1 para j = 1, 2, 3 mientras que e i e k = 0 siempre que i ^ k. 3 Entonces para un cuadrivector y = y' e i de ese espacio se tiene: í ^ = (y ") 2 - (y') 2 - (y 2 ) 2 -(y 3 ) 2 Si y 0 = c^t, y si las coordenadas y 1,y 2,y 3 representan puntos del espacio físico (tridimensional euclidiano) donde se halla el frente de onda correspondiente a un destello luminoso producido en el origen en el instante inicial t = 0y que se propaga en el vacío, entonces para ese cuadrivector y y = 0 aunque y ^ 0. Cuando se tiene una métrica propiamente dicha, se pueden definir conceptos geométricos que extienden la teoría de superficies a n dimensiones, puesto que se puede definir productos internos en todas las variedades lineales tangentes. Así se puede introducir el ángulo entre dos direcciones a y b dadas en la variedad lineal T n (P) tangente a un punto P de V n : cosy = a b mi a 2 = a a 2 b b Esto a su vez permite extender la definición de direcciones ortogonales (vista en para superficies bidimensionales) a cada punto de la variedad. Una tarea importante es buscar una expresión analítica de la diferencia local, es decir, la diferencia en las proximidades de un punto, entre una variedad V n y el espacio euclidiano o pseudo-euclidiano que le es tangente en ese punto. Esa expresión analítica caracteriza la curvatura de la variedad en un punto dado. Es importante remarcar que el concepto de curvatura de una variedad, en el sentido de su geometría intrínseca, no tiene en principio nada que ver con la idea de que la 121 En el caso del espacio de Minkowski numeramos los vectores de la base y las coordenadas a partir de 0 en lugar de 1 para destacar el rol especial del tiempo entre las cuatro coordenadas de un evento. 145

146 variedad se encuentra inmersa en un espacio mayor, que la rodea y en el cual la variedad de algún modo se curva, como vemos que se curva en el espacio físico de nuestra percepción, un modelo de superficie hecho mediante una hoja delgada de estaño. La curvatura intrínseca se define a partir de las propiedades métricas propias de la variedad considerada, y mide la diferencia entre las propiedades geométricas locales y las propiedades que posee un espacio euclidiano o pseudo-euclidiano de igual dimensión, la variedad lineal tangente. Será considerada en Inmersión de variedades riemannianas en espacios euclidianos Pero también es lícito preguntarse por la geometría extrínseca, la geometría que depende de cómo la variedad se halla inmersa en un espacio euclidiano generalizado. Esto a su vez conduce a preguntarse por la dimensión N de un espacio euclidiano E N, espacio en el cual la variedad n-dimensional pueda ser embebida. Supongamos que las coordenadas cartesianas ortogonales de los puntos de E N son (X 1, X 2,..., X N ). Entonces V n se puede caracterizar por N funciones X 1 = 3 1 (x 1, x 2,..., x n ) k=l,2,...,n Mientras que las coordenadas (x 1,x 2,...,x n ) son intrínsecas a la variedad, como lo son las coordenadas (M,V) empleadas por Gauss en su teoría de superficies, las funciones X 1 = 3 1 (x 1,x 2,...,x n ) dan las coordenadas cartesianas extrínsecas a la variedad, al igual que las funciones x = X(M, V) y = extrínsecas de una superficie en la teoría de Gauss. El elemento de línea en E N, es decir ds 2 línea sobre la variedad 2 1=n/ k mediante las funciones X 1 = 3 1 (x 1,x 2,...,x n ). V) Z = Z(M, V) dan las coordenadas cartesianas 2 = (dx 1 ), se debe reducir al elemento de i=i ds = (dx ) cuando las coordenadas en E N se expresan 1=i Para que en E N se puedan embeber todas las variedades de dimensión n, el número N de funciones de (x 1,x 2,...,x n ) debe ser suficiente para determinar los coeficientes g i 1 (x 1, x 2,..., x n ) para todas las variedades posibles. Como por simetría solo hay n 1) coeficientes independientes, el número mínimo de funciones X 1 = 3 1 (x 1,x 2,...,x n ) y por tanto la mínima dimensión N del espacio euclidiano generalizado debe verificar: N = n l) Si n=2 (caso de las superficies estudiadas por Gauss), resulta N=3. Pero si n=4 (caso del tiempo-espacio curvo de la teoría general de la relatividad) resulta N=10. Si la variedad V n se embebe en un espacio euclidiano, por cada punto de la variedad se puede construir una variedad lineal tangente n-dimensional que cumple el mismo rol geométrico que el plano tangente a una superficie del espacio tridimensional. 146

147 Constituye una aproximación lineal a la variedad en un entorno del punto. Igual que en el caso de las superficies bidimensionales, se puede analizar el apartamiento (las curvaturas) de la variedad respecto su aproximación lineal en cada punto. Todo esto es parte de la geometría extrínseca. 122 Consideremos ahora algunos ejemplos de variedades embebidas en un espacio euclidiano de 4 dimensiones, E4, de coordenadas cartesianas ortogonales x 13 x 2, x 3, x 4. La ecuación xf + x 2 + x x^ = R 2 define una variedad esférica de 3 dimensiones (3- esfera), de radio R. Si anulamos una de las coordenadas cartesianas, se obtiene como resultado que la traza de la esfera en el correspondiente sub-espacio euclidiano tridimensional es otra esfera, ahora bidimensional, con el mismo radio. Introduciendo un nuevo sistema de coordenadas angulares X6,P la variedad esférica tridimensional se puede representar así, teniendo en cuenta que en este caso la coordenada X varía entre 0 y 2n; 6 entre 0 y n; p entre 0 y 2n : x 1 = R-cos %send^ cosp x 2 = R-cos % senbsenp x 3 = R-cos X cos6 x 4 = R sen% Por tanto es una variedad finita, cerrada y en sí misma ilimitada. Es finita porque la distancia entre dos cualesquiera de sus puntos está acotada. Es cerrada e ilimitada porque recorriéndola por adentro no se encuentra una frontera. En forma análoga se puede definir en E 4 una variedad hiperbólica de 3 dimensiones (3- hiperbolide de dos hojas), por la ecuación x x^ + x x^ = R 2. Si por ejemplo tomamos x 1 = 0, es decir si nos restringimos a la traza de la variedad sobre un sub-espacio euclidiano tridimensional, obtenemos que dicha traza viene descrita por la ecuación x^ + x x^ = R 2 que corresponde a la superficie conocida como hiperboloide de una hoja. Lo mismo ocurre si hacemos x 2 = 0 o x 3 = 0. Pero si tomamos x 4 = 0 se obtiene la superficie esférica x^ + x^ + x 3 2 = R 2. Introduciendo un nuevo sistema de coordenadas la variedad hiperbólica tridimensional se puede representar así, teniendo en cuenta que ahora X varía entre 0 y +TO, mientras que las coordenadas angulares varían como de costumbre, es decir 6 entre 0 y n; p entre 0 y 2n : x 1 = R^ cosh X s en6cosp x 2 = R^ cosh Xsend^ senp x 3 = R^ cosh X^ cos6 x 4 = R sen&x Puesto que el coseno hiperbólico y el seno hiperbólico son funciones no acotadas (tienden a + ^ cuando X tiende a + ^), tenemos una variedad tridimensional que, además de curvada e ilimitada, es un espacio abierto en el siguiente sentido: nos Como se verá en el capítulo 12 sobre el problema cosmológico, algunas de estas variedades tridimensionales aparecen como modelos en gran escala del espacio físico, al estudiar la dinámica del tiempo-espacio del Universo aplicando el principio cosmológico débil y el postulado de Weyl. 147

148 podemos alejar tanto como queramos a partir de un punto, puesto que no hay una cota superior para las distancias entre puntos del espacio. A su vez la ecuación x# - x 2 - x^ - x 3 2 = E 2 define en el espacio E 4 otra variedad hiperbólica de tres dimensiones (3-hiperboloide de una hoja), cuya traza para x l = 0 es x^ - x x 3 2 = E 2, que es la ecuación en un espacio euclidiano tridimensional de la superficie conocida como hiperboloide de una hoja. Finalmente, la ecuación 2 a x x l - x 2 - x 3 = 0 define en E 4 una variedad parabólica tridimensional (3-parabolide). Todas estas variedades tridimensionales se pueden describir en forma intrínseca comenzando por el elemento de línea de E 4 (ds 2 = (dx^) 2 + (dx 2 ) 2 + (dx 3 ) 2 + (dx 4 ) 2 ), despejando x 4 a partir de la ecuación extrínseca (en E 4 ) de cada variedad en función de E y de x l, x 2, x 3 e introduciendo coordenadas esféricas x l = r -cos#- cosp, x 2 = r- cos0^ senp y x 3 = r-sen^. Se obtiene así, luego de algunos cálculos, una expresión general intrínseca para el elemento de línea de estas variedades tridimensionales curvadas expresado en función de las tres coordenadas r, 0, p: ds 2 =(l + & 2 (r)) dr 2 + r 2 d0 2 + r 2 - sen0 dp r 2 2 r 2 Para: la 3-esfera & 2 (r) =, el 3-hiperbolide de dos hojas & 2 (r) =, el E 2 - r 2 E 2 + r /\ r 2/\ r 3-hiperboloide de una hoja & (r) = y el 3-paraboloide & (r) = -. r 2 - E 2 a 2 En general la inmersión de una variedad tridimensional curva en un espacio euclidiano., ir n* (n +1) 3 (3 +1), requiere un espacio de N = ^ = ^ = 6 dimensiones, o sea E 6. En consecuencia, las variedades definidas por una ecuación del tipo 3(x l, x 2, x 3, x 4 ) = 0 en E 4 no agotan las variedades tridimensionales posibles. Para ver esto, comencemos por observar que un elemento de línea de E 4, que adopta la forma ds 2 = (d^) 2 + (dx 2 ) 2 + (dx 3 ) 2 + (dx 4 ) 2 en coordenadas cartesianas ortogonales, introduciendo coordenadas esféricas en E 3 puede llevarse a la forma siguiente: ds 2 = (dr) 2 + r 2 (d0) 2 + r 2 sen0(dp) 2 + (dx 4 ) 2 Si x 4 se despeja, a partir de 3(x l,x 2,x 3,x 4 ) = 0, en función de x l,x 2,x 3 y estas últimas tres coordenadas se representan a su vez en coordenadas esféricas, (dx 4 ) 2 término no negativo de la forma g 2 (r, 0, p) (dr ) 2. aporta un Por este motivo el coeficiente que multiplica a (dr) 2 en la fórmula para ds 2 es necesariamente mayor o igual a uno. Un ejemplo de variedad tridimensional curvada que no se puede embeber en E 4 y que, como se verá en el capítulo 12, posee interés cosmológico, es la variedad cuyo elemento 148

149 r f E 2 N de línea viene dado por ds 2 = dr 2 + r 2 dd 2 + r 2 sen 2 d dp 2, puesto que l E 2 + r 2 ) E 2 el coeficiente 2 7 que multiplica a (dr) 2 es inferior a uno. No obstante, esta E variedad se puede embeber en un espacio tetra-dimensional no euclidiano Variedades 3-D con simetría esférica. Representación conforme en E 3. Finalmente prestemos atención a un tipo de variedad tridimensional (3-D) que posee simetría esférica en torno a uno de sus puntos, designado por O 124 y tomado como origen de un sistema de coordenadas. El elemento de línea se puede poner así: ds 2 = g 2 (r) dr 2 + r 2 (dd 2 + sen 2 d dp 2 ) (0 < r < r máx, 0 <d<n, 0 <p< 2n) La función g(r) es regular y no se anula en 0 < r < r máx. En este intervalo se la puede tomar positiva. Es posible que r máx sea infinito. En particular, para la construcción del modelos cosmológicos nos interesan los casos que presentan g(r) = 1 r 2 con = -!, = 0 y = r 0 En estudiaremos algunas propiedades de las curvas geodésicas y en estudiaremos algunos aspectos de la curvatura de este tipo de variedad no euclidiana. Ahora, por su importancia en la discusión de los modelos cosmológicos que se realiza en el capítulo 12, veamos la posibilidad de una representación conforme en E 3. Por definición una correspondencia punto a punto entre dos variedades es conforme cuando los elementos de línea son localmente semejantes: ds 2 = A 2 ds 1 2 El factor de semejanza local A puede variar de un punto a otro, siendo en ese caso una función regular de las coordenadas del punto, pero no se anula. Como el ángulo entre dos curvas que se intersecan en una variedad es igual al ángulo entre sus imágenes en la otra variedad, la representación de una variedad en la otra se denomina conforme. En el caso particular de las variedades con simetría esférica buscamos una representación conforme con ds 2 = dr r 2 (dd 2 + sen 2 d- dp 2 ). g 2 (r) dr 2 + r 2 (dd 2 + sen 2 d dp 2 )= A 2 (dr r 1 2 (dd 2 + sen 2 d dp 2 )) 123 Se la puede embeber en una variedad lineal de cuatro dimensiones con la (pseudo)métrica Lorentziana ds 2 = (dx 1 ) 2 + (dx 2 ) 2 + (dx 3 ) 2 (dx 4 ) 2, introduciendo la restricción x^ = E 2 + x^ + x^ + x^para caracterizar la variedad curvada como una hiper-superficie en este espacio no euclidiano. Nótese que si se pone x 4 = 0 se obtiene un sub-espacio euclidiano E 3 en la variedad lineal no euclidiana. A partir de la restricción y la (pseudo) métrica un cálculo simple introduciendo coordenadas esféricas en el sub-espacio E 3 de la variedad Lorentziana conduce al elemento de línea que se buscaba. 124 El caso general de las variedades métricas con simetría esférica puede verse en el libro de T. Levi- Civita "The absolute differential calculus", capítulo 12, Blackie & Son, Glasgow, U.K.,

150 Esa representación se puede construir siempre y cuando g(r) dr = A-drj y r = A-r, g (r) 1 Eliminando A se obtiene: -dr = -dr, Integrando aparece una función que r r, vincula uno a uno r con r : r, ln 1 - = [ gy-) dr r Jr 1w * r De esta expresión podemos hallar la función r = r(r,). Entonces, como r = A-r,, el \ r (r ) factor de semejanza local se puede expresar así: A(r,) = Si g(r) = 1 la integración conduce al factor de semejanza: A 2 (r,) = r 2 1 ^ 1 + * ri \ 2 2 # R H 1 A Tensores y curvatura. Puesto que la variedad de cuatro dimensiones necesaria para plantear las ecuaciones del campo gravitatorio no es propiamente una variedad métrica, a diferencia de los 3- hiperboloides, la 3-esfera, el 3-paraboloide y en general las variedades tridimensionales con simetría esférica que consideramos en las secciones y precedentes, en esta parte estudiaremos variedades pseudo-métricas, más generales, que abarcan el caso que interesa en la teoría generalizada de la relatividad. Siguiendo el uso establecido en física, de ahora en adelante haremos referencia a ellas como variedades de Riemann, aunque esta denominación debería restringirse a las variedades provistas de una métrica propiamente dicha Tensores 125 Volviendo ahora a la geometría intrínseca de las variedades de n dimensiones, la propiedad fundamental del elemento de línea es que permanece invariante al cambiar las coordenadas. Consideremos un cambio de coordenadas: x J = f J (x' 1,x' 2,...x' n ) para j=1, 2,..., n n df' " df 1 Entonces: dr' = T dr" = T a/ dr" dr 1 = T dr' m = T am' dx' m UX m=1 m' Las componentes de un vector que se transformen igual que los diferenciales de coordenadas se denominan componentes contra-variantes y se habla de un vector contra-variante o de un tensor de orden uno contra-variante. Los coeficientes locales a z m verifican: a z m ' al. = S?. T aí=8 1 m z m' = ^ z correspondientes al cambio de coordenadas inverso r i siendo 8% y 8; Kronecker) iguales a 1 cuando los índices son iguales e iguales a cero en otro caso. 1 (deltas de Un estudio conciso sobre análisis tensorial realizado en el espíritu en que se desarrollan las aplicaciones en la teoría de la gravitación de Einstein puede hallarse, por ejemplo, en L. Santaló, "Fecíoresy tensores con sws ap/ícac/ones", EUDEBA, Buenos Aires,

151 Consideremos ahora un campo escalar o tensor de orden cero i(x l,x 2,...,x n ) cuyo diferencial es = V i dx 1 i dx 1 Los escalares, por definición, permanecen invariantes bajo un cambio de coordenadas: di = dx 1 = V^Vdx m '= V^r V«m' dx' m = V V dx m v dx ~fdx m r dx ^ m l 1 ^ 'dx 1 «m De donde resulta = V - 1 a l m' Las componentes de un vector que se transforman 3x m r dx 1 m como las componentes di dx 1 (es decir, como las componentes del gradiente de un escalar) se denominan componentes co-variantes, y se habla de un vector co-variante o tensor co-variante de orden uno. De la invariancia del elemento de línea: V g i k dx'dx k = V g r m dx' l dx' m y de las i, k =1 1', m'=1 ecuaciones de transformación de los diferenciales de las coordenadas resulta: n Zg,a,' i a ' k Oi, k 1 m i 1 =1 Un ente que se transforma como las componentes g ik (x 1,x 2,...,x n )del elemento de línea se denomina tensor co-variante de orden dos. En particular el campo tensorial de componentes g i k que define la métrica o la pseudo-métrica a través del elemento de línea se denomina tensor métrico de la variedad. Un tensor muy importante, relacionado con el tensor co-variante de componentes g i k, es el tensor métrico contravariante cuyas componentes g 1 ' k forman los elementos de la matriz inversa G -1 matriz G cuyos elementos son los g i k 126 : de la V g i,k -gk,, = V g-k -g k,! = 8 (8 = 1 s i i * j Y 8 = 0 s i i = j ) k Esta propiedad del tensor métrico se utiliza para subir o bajar índices en un tensor. Así, a partir de las componentes contra-variantes v J de un vector obtenemos sus componentes co-variantes v i = V g i. v ;, y del tensor en forma mixta (una vez contra- ] variante y dos veces co-variante) T. k obtenemos las formas contra-variante T p,q,t = V g ' ^ g ' ^ f ; y co-variante T^. = V g pj g q yt ] ; j,k - k 126 Esa matriz G -1 inversa respecto de G existe siempre, puesto que en un espacio de Riemann se supone que det[g i k ] * 0 en todo punto. 151

152 En cada punto de la variedad, a partir de las leyes de transformación de sus componentes bajo cambios de coordenadas, se pueden definir tensores de orden superior, considerando como un mismo tensor todas las formas que se puedan obtener una de otra subiendo o bajando índices con ayuda del tensor métrico. En general un tensor de orden m+n que es m-veces contravariante y n-veces covariante se dice que es de orden de variancia (m,n). Por ejemplo, T yk l representan las componentes de un tensor de orden de variancia (1,2), T M,! representan las de un tensor de orden de variancia (3,0) y T pqi las de uno de orden de variancia (0,3). El orden en que aparecen los índices covariantes y contravariantes es importante y debe ser mantenido: desde el punto de vista de las operaciones del análisis tensorial, las componentes T jk l T'jm. Los campos de tensores (digamos T jk l ) no corresponden al mismo objeto matemático que las componentes se pueden multiplicar por un escalar (digamos, por a) originando un campo de tensores del mismo orden de variancia y estructura de índices: a-t. k l Los campos tensoriales del mismo orden de variancia y estructura de índices se pueden sumar en cada punto originado un nuevo campo de ese mismo orden: por ejemplo T k' + /y k' a partir de los tensores de componentes T. k l y /. k l. También se pueden multiplicar las componentes para construir tensores de orden superior: por ejemplo multiplicando las componentes del vector covariante v J de orden (1, 0) por las componentes del tensor covariante de orden (0, 3) T p t, se obtiene el tensor t de componentes v ; -Tp i y de orden de variancia (1, 3). Esta operación se denomina producto externo de tensores. No es conmutativo. Se define un proceso de contracción de índices involucrando un índice covariante y un índice contravariante, que por suma sobre esos índices disminuye en dos el orden del tensor de esta forma: ^, k, Í = T^ l k Cuando la contracción de índices se aplica al producto externo de tensores produce un tensor denominado producto interno de los factores: ^ v k - T^ q k = E k Cuando el número de índices covariantes y contravariantes lo permite, la contracción de índices puede aplicarse a más de un par de índices. En lo que sigue no recurriremos a la convención de Einstein, quien propuso eliminar los símbolos de sumatoria asociados a la contracción. Para determinar si un objeto dado por un conjunto de componentes indexadas es o no un tensor se puede recurrir a un teorema conocido como ley del cociente: siempre que el producto interno formal de las componentes del objeto por las componentes de un tensor arbitrario da como resultado las componentes de un tensor, entonces el objeto mismo es un tensor. Así, si dado cualquier tensor B l,; y un mismo objeto = r k,/ resulta que ^= r s, t - B s, t = C es un vector contravariante, entonces = r k, / es un tensor. q 152

153 En general las derivadas parciales de las componentes de un campo tensorial no forman un nuevo campo tensorial. Para formarlo se requiere un procedimiento especial de derivación, denominado derivación covariante, que se considera en la próxima sección. Estos campos tensoriales así construidos permiten expresar las leyes físicas en forma independiente de las coordenadas. Como contrapartida la formulación resultante es una formulación local de las leyes. En este sentido el análisis tensorial es la herramienta óptima para formular un marco teórico basado en el principio de considerado en el capítulo 3. contigüidad Coeficientes de conexión, desplazamiento paralelo y derivadas covariantes Supongamos que a cada punto (x 1,x 2,...,x n ) de una variedad regular V n le asignamos su espacio tangente E n (x 1, x 2,..., x n ), en el cual seleccionamos una base (e 13 e 2,...,<? n ) y n un vector v = v 1 e.. ;=1 Consideremos ahora una curva regular y en la variedad V n Esa curva viene dada por las funciones (x 1 (u),x 2 (u),...,x n (u)) del parámetro real u. Supongamos que a cada punto (x 1 (u),x 2 (u),...,x n (u)) de la curva y le hacemos corresponder un vector localizado en la variedad lineal tangente en ese mismo punto: vv (u),x 2 (u),...,x n (u)) = v> (x 1 (u),x 2 (u),..., x n (u)) e ; (x 1 (u),x 2 (u),...,x n (u)) i=1 Esta expresión puede resumirse poniéndola en términos de funciones del parámetro u : n v[u] = v ; [u] e. [u] - =1 A cada punto de la curva y se le hace corresponder un vector contenido en la variedad lineal tangente a V n en ese punto. Como todas las variedades lineales tangentes son equivalentes, podemos representar ^(x 1 (u),x 2 (u),...,x n (u)) como función vectorial en una misma variedad lineal, al igual que los campos vectoriales formados por los vectores de las bases de las variedades lineales tangentes en cada punto de y: fo (x 1 (u), x 2 (u),..., x n (u)), 2 (x 1 (u), x 2 (u),..., x n (u)),..., en (x 1 (u), x 2 (u),..., x n (u))} Asumimos que los vectores e.(x 1,x 2,..., x n ) son funciones regulares de (x 1,x 2,...,x n ). Entonces: - d r(x 1,x 2,...,x n ) = P M (x 1,x 2,...,x n ) e, (x 1,x 2,..., x n ) dx t f Las n 3 funciones r! y,i(x 1,x 2,...,x n ) se conocen como coeficientes de conexión. 153

154 Si dr = S-e?.(x 1,x 2,...,x n ) y e. = g t en cada punto de la variedad, el ;=i n elemento de línea se puede escribir así: ds 2 = dr dr = S e e. - dx l - dx ; a a??? a Derivándolas componentes del tensor métrico: -g g i. = -ee i e i + e i -e ax^l,; i ax 1 l ; l ax 1 Estas derivadas se pueden expresar en términos de los coeficientes de conexión y de las componentes e i e. = g i.: d n n dx^gl^ = 2 r '',i - g',i + S r 1 i,i - g', l Teniendo en cuenta la definición de las componentes contravariantes g',j métrico, vistas en 9.5.1, luego de algunas transformaciones algebraicas se obtiene: r i = 1 ^ _li í f e, d g;, ' d g;, i ^ 2 S g dx ; 3x 1 dx' J ^ '=i l =1 del tensor Se advierte que los coeficientes de conexión, también conocidos como símbolos de Christoffel, quedan determinados por el tensor métrico de la variedad y sus derivadas parciales de primer orden respecto de las coordenadas. Como este tensor es simétrico, los coeficientes de conexión no son independientes 127. En particular: V., i = r'i,. Las componentes r. k' no forman un tensor. n Dado v[w] = S [w] - e. [w] podemos calcular su derivada respecto del parámetro w. ;=1 En primer lugar: v?[w] = S( v ; [w]-?. [w] + v ; [w]-?. [w]) Pero sabemos que se verifica: dw =1 dw dw r 1 ^dr 1 d e. [w] = S ^ (w) f r d?? /(x, 1,x, 2,...,xA n )= Sr l M M (x 1,x 2 2,..., xa n )-dlgr dx (x 1,x 2,...,x n dw i t =1 dw HM dx M ', t =1 dw En consecuencia obtenemos: -d-?[w] = S 4v' [w]+ S r ; 'l,i - v' [w] - ^ ) -? [w] dw, =1 dw ' =1 dw 127 Una exposición detallada de los fundamentos sobre variedades y tensores puede hallarse en el libro de A. Lichnerowicz "Elementos de cálculo tensorial", Aguilar, Madrid, Para un estudio conciso pero riguroso sobre análisis tensorial, ver por ejemplo, el libro de L. Santaló, "Fee/ores y tensores con sws ap/i'caci'ones", EUDEBA, Buenos Aires, A nivel avanzado se puede consultar el libro, que presenta un enfoque moderno, de D.Lovelock y H.Rund "Tensors, dí/?eren/i'a/yorrns and vari'a/i'ona/ ^ri'nci'p/es" Wiley, New York, 1975, o el clásico de T. Levi-Civita "The absolute differential calculus", Blackie & Son, Glasgow, U.K.,

155 Las componentes v ; [w] = v 1 [w]+ V Pi,i-v! [w]-^ (w) (7 =1% 2,...,n ) - w dw 1= 1 dw d n definen un vector derivada: v[w] = V ( v ; [w]) - e. [w] dw ~ 1 - w Los vectores de una variedad lineal se pueden describir mediante una única base de vectores por el origen. En ese caso las componentes del tensor métrico e i e. = g i. son constantes al pasar de un punto de la variedad a otro: la variedad lineal misma es su propia variedad tangente en cada uno de sus puntos. Si las componentes g i. son constantes, se anulan idénticamente todos los coeficientes de conexión. Entonces sobre una curva definida en una variedad lineal que se describe d mediante una base única, se verifica: v ; [w] = v ; [w] (7 = 1,2,...,n) - w dw Si trasladamos un vector v paralelo a sí mismo sobre una curva y contenida en una variedad lineal, en condiciones en las que las componentes del tensor métrico no varían, entonces las componentes del vector respecto de la base tampoco varían: w - [w] = W - [w] = 0 dw Pero si modificamos la base de vectores al pasar de un punto a otro, el desplazamiento d n S paralelo del vector se produce siempre y cuando v[w] = V( v ; [w]) e / [w] = 0 dw =1 w sobre Y, es decir siempre que: v ; [w] = 0 (7 = 1,2,...,n) w Es posible generalizar esta caracterización del transporte paralelo de un vector a lo largo de una curva al caso de las variedades riemannianas que hemos estado considerando. Diremos que transportamos en forma paralela el vector de componentes v J [w] sobre la curva y cuyas coordenadas vienen dadas por (x 1 (w), x 2 (w),..., x n (w)) siempre y cuando a lo largo de esa curva se verifiquen las ecuaciones: v ; [w] = 0 w (j = 1, 2,...,n) En forma equivalente: v 1 [w] = - VPi,i v i [w]- dx (w) (7 = 1,2,...,n) dw i 1 =1 Teniendo en cuenta que v 1 [w] = V ^-v 7 (x 1 (w),x 2 (w),..., x n (w))- dx (w), la dw k=1 dx 1 dw ecuación del transporte paralelo se verifica si a lo largo de la curva y : dw ^ v ' (x 1 (w), x 2 (w),..., x n (w))+ Vr(x 1 (w), x 2 (w),..., x n (w))-v! (x 1 (w), x 2 (w),..., x n (w)) = 0 dx i, k=1 ( 7,1 = 1, 2,..., n ) En esta ecuación ha aparecido el siguiente tensor mixto de segundo orden, denominado derivada covariante del vector de coordenadas v J : 155

156 d r\ j ( 1 2 n ^ j ( 1 2 n ^. V^ -r^/ f 1 2 n ^ i f 1 2 D^ (x,x,..., x ) = v y (x,x,..., X ) + V r i,k (x,x,..., X ) V (x,x,..., X ) dx Entonces una condición que asegura el cumplimiento de la ecuación del transporte paralelo del vector a lo largo de la curva y se puede resumir estableciendo que sobre esa curva se anula la derivada covariante D k v ; (x 1 (w), x 2 (w),...% x n (w)) = 0 i, k=1 La derivación covariante se introduce debido a que las derivadas parciales de las componentes de un campo tensorial no constituyen las componentes de otro tensor, con excepción del caso en el que las variedades son euclidianas o pseudo-euclidianas y se describen mediante sistemas de coordenadas cartesianas ortogonales. Generaliza la derivación parcial y permite construir nuevos campos de tensores. Se puede definir para tensores de cualquier orden de covariancia o contravariancia, empleando los símbolos de Christoffel y las componentes del tensor métrico correspondiente a la variedad sobre la que se trabaja. Para un campo tensorial dos veces contravariante la derivada covariante resulta ser un tensor de orden tres, una vez covariante y dos veces contravariante: D k r% k d dx k De esta fórmula, junto con la relación + V r v k, i r^' 2 " + V r v k, i i r- l -, ^ ^ k, i=1 i, k=1, S^^S = 8) y la definición de los m=1 coeficientes de Christoffel en términos de las componentes del tensor métrico se deduce que la derivada covariante D k^!> 1 variedad: D k^!' ; (x 1, x 2,..., x n )= 0 del tensor métrico es nula en todos los puntos de la De esta propiedad del tensor métrico y la definición de transporte paralelo de un vector n (de componentes V j ) sobre una curva, se desprende que gv j -V! -V ; transporte paralelo. Cuando la variedad posee una métrica propiamente n i - =1 no varía con el dicha, V Si j V! V ; puede interpretarse como el cuadrado de la longitud del vector, la cual, i - =1 en consecuencia, no varía durante el transporte paralelo. Efectuando una contracción de índices a partir de la derivada covariante D k r'' J del i ' 3 tensor escrito en forma contravariante T ', obtenemos el tensor V D i r 1,J divergencia covariante. i=0 denominado Cuando los coeficientes de conexión r. k son nulos, la derivada covariante se reduce a d. ' 3 d -T' 1 y la divergencia covariante se reduce a V -T 1, 3. dx k t 0 dx l Como se verá en la sección 9.5.4, cuando los coeficientes de conexión se anulan en todos los puntos de la variedad, ésta posee curvatura nula: se dice que es una variedad plana. El tiempo-espacio de Minkowski de la relatividad restringida es un ejemplo de 156

157 variedad plana, en el cual d_ dx k es un tensor de orden de variancia (2,1) y 3 d V -r'% J es un tensor (1, 0), es decir, un vector contravariante. t 0 dx' ' ' Curvas geodésicas En una variedad con una métrica propiamente dicha, el rol que tienen las rectas del espacio euclidiano lo tienen las líneas geodésicas, que unen dos puntos lo suficientemente próximos mediante el arco de curva de longitud mínima. Teniendo en cuenta que ds 2 = VSi kdx! dx k, la longitud del arco y A B de la curva y i, k=1 que une los puntos A y B de parámetros w A y w B viene dada por: «B S ( Y A,B )= Zj. d^ j k^ Si ' k dw dw 128 Aplicando las herramientas del cálculo de variaciones, se obtiene el siguiente sistema de ecuaciones diferenciales ordinarias, en general no lineales, cuyas soluciones permiten la determinación de las geodésicas que pasan por cada punto de la variedad y en cualquier dirección: d 2 x i (s) ^ ^ i,/x 2/x /\\ dx ; (w) dx k (w) + V r ; (x 1 (w), X 2 (w),..., x" (w)) U.^ U.= dw 2 -, k dw dw 0 i = 1,2,...,n Como condiciones iniciales se requiere especificar un punto de la variedad y una dirección, dada por las componentes de un vector que entonces va resultar tangente a la línea geodésica en el punto inicial. dw Consideremos, a vía de ejemplo, una variedad tridimensional con simetría esférica, del tipo introducido al final de la sección 9.4. El elemento de línea viene dado por: ds 2 = S 2 (r) dr 2 + r 2 do 2 + r 2 sen 2 0 d^2 Supondremos que la función regular S(r) es siempre positiva, con S(o) = 1, S(0) = 0 dr d 2 y - S(o)^ 0. dr 2 La longitud de un arco de curva y, B de extremos A y B, con parámetro w, y contenido en esta variedad viene dada por: S ( "B 2 Y A, B ) = J s2(r) f + r2 fo 2 + r 2 s e n o f * dw l dw J l dw J l dw J A Las ecuaciones de las líneas geodésicas para una variedad como ésta se pueden obtener directamente aplicando el método que se explica en el capítulo 11 (sección ). 128 Para una brevísima introducción al cálculo de variaciones, incluyendo las ecuaciones de Euler (de las cuales las ecuaciones de las geodésicas constituyen un caso particular), ver la sección Para un desarrollo más detallado, desde una perspectiva física, puede consultarse el libro de J.L. Basdevant "Fari'a/i'ona/ _pr/ncip/es in.&ys/cs", Springer Verlag, New York,

158 Introdueimos la siguiente funeión, donde r = 6 = Pp = dw dw dw 3(r,6,pr,6,p) =Vg 2 (r) r 2 + r r 2 sen 2 6p 2 Entonees las eeuaeiones de Euler para las geodésieas se pueden eseribir así: d f g 2 (r) = g(r) g'(r) r 2 + r- (6 2 + sen 2 6-p 2 ) r dw 3 v y 3 A dw v 3 2 C/tl/tíJ - J /V sen6- eos 6. f- 2 sen 2 d 6 l p 2 3 dw 3 p = o y Del estudio de estas eeuaeiones se desprende que las eurvas earaeterizadas por6 = efe, p = efe y r variable entre 0 y x son todas ellas geodésieas de la variedad. Si ponemos r = efe y elegimos dos puntos AyB sobre la superfieie así determinada, la longitud de un areo de eurva que une A eon B sin abandonar dieha superfieie viene dado p o r : S( YA,B ) = r - J A d6l 2 2* fdpl 2. I + sen 2 6-\ \ -dw dw y v dw y Entonees el problema de hallar las eurvas geodésieas sobre la superfieie en euestión se reduee al de hallar las geodésieas sobre una esfera, que son areos de eíreulo máximo. No obstante, estas superfieies r = efe (pese a que se denominan esferas geodésieas) no están formadas por curvas geodésicas de la variedad tridimensional: no son superficies geodésicas. Para verlo aleanza eon poner r = efe en las eeuaeiones de las geodésieas. La primera de ellas se reduee a sen 2 6 pp 2 = 0 Si sen6no se anula, la úniea solueión posible es 6 = efe y p = efe. Junto eon r = efe determinan un punto en la esfera geodésiea y no una eurva eontenida en dieha esfera. Si sen6 = 0 entonees 6 = 0 o 6 = n. En ese easo tenemos solo dos puntos, los polos de la esfera. En general, para determinar las geodésieas hay que resolver el sistema de eeuaeiones difereneiales no lineales que las earaeteriza eomo eurvas de longitud de areo mínima. r 2 sen 2 6 De la tereera eeuaeión para las geodésieas se desprende que pp = efe 3 Si ponemos p = efe, las primeras dos eeuaeiones se redueen a un sistema de eeuaeiones difereneiales no lineales en términos de r y 6 solamente. Las solueiones son geodésieas eontenidas en la superfieie p = efe, la eual es entonees una superficie geodésica. Utilizaremos este resultado en para ealeular las eurvaturas de las variedades simétrieas 3-D. Ahora espeeifiearemos los símbolos de Christoffel en un punto eualquiera de una de estas variedades, desarrollando las derivadas indieadas en las eeuaeiones de Euler. Si tomamos la longitud de areo eomo parámetro y tenemos en euenta que en este easo 3 = 1, las eeuaeiones de las geodésieas se pueden poner bajo la forma: d 2 r r f d6l 2 r f dpl 2 0 rr r rr r sen i 00 I I +ipp I I = 0 i 66 = ^T i pp = ds 2 v ds y V ds y g 2 (r) g 2 (r) d fd6l fdrl fdpl 2 ^ 1 _ - + rv I M \ + r%p I I = 0 rv = ^6pp=-sen6 eos6 ds v ds y v ds y v ds y r 158

159 -Y+2- ^ (.[ Y + 2- r> [ nf = o r%=! 1 ^ = ds ^ ds J ^ ds J ^ ds J ^ ds J r Los demás símbolos de Christoffel no relacionados con los anteriores por relaciones de simetría, son nulos. Cuando no existe una métrica propiamente dicha, como ocurre con las variedades que aparecen en la teoría generalizada de la relatividad, es necesario definir las líneas geodésicas de otra manera, sin recurrir a la longitud de arco. Esta definición se puede hacer recurriendo al desplazamiento paralelo. Definiremos una curva geodésica como aquella cuyos vectores tangentes v 1 [w] = (w) resultan de un proceso de transporte paralelo de un vector, que define dw una dirección inicial en un punto inicial, a lo largo de la curva. Si v J [w] son las componentes del vector que sufre el transporte paralelo, entonces sabemos que v 1 [w] = -^T r,i -v j [w]- (w) dw j i=] dw Sustituyendo en esta ecuación v ; [w]= (w) y reordenando se obtiene en este caso dw general la misma ecuación de las geodésicas obtenida en el caso particular en el que la variedad posee una métrica propiamente dicha. Puesto que se basa en transportar en forma paralela, sobre la curva, el vector que caracteriza la dirección en cada punto de esa misma curva, podemos resumir entonces la definición de una curva geodésica diciendo que una geodésica es una línea autoparalela Curvatura de una variedad de n dimensiones Consideremos nuevamente las variedades tridimensionales cuyos elementos de línea vienen dados por expresiones del tipo ds 2 = S 2 (r) dr 2 + r 2 - d6 2 + r dq 2 donde la función regular s(r) es siempre positiva con S(o) = 1, S(o) = O y dr d 2 r TS(o)^o. Introduciendo el radio geodésicop= TS( ) dr 2 o esas variedades se puede expresar así: ds 2 = dp 2 + r 2 (p)-(d6 2 + r *(p) es la función inversa de p = JS(4). el elemento de línea de 2 0-dq 2 ) donde Supongamos que fijamos los valores del radio geodésico y del ángulo 6. En ese caso, si n ponemos 6 = y si variamos el ángulo q entre o y2n, obtenemos una circunferencia geodésica de longitud l c (p) = J s(q) = 2n r(p) Jo 159

160 Desarrollando en poteneias del radio geodésieo, siendo o(p 3 ) un resto que tiende a eero eon p por lo menos eomop 4 : r (p) = r (0) + dp (o) - p +! p (o)-p 2 + p (o)-p 3 + o(p 3 ) dp 2 dp 6 dp Caleulando los eoefieientes del desarrollo de r(p) en poteneias del radio geodésieo se obtiene: r(0)=0 * (0)=-^=1 (0) = ^-TT nr ^ ^ = 0 W dp V ' g(r(0)) dp 2 W g 3 (r(0)) dr d 2 r ( 0 ) = - - ^ fg 3 (r (0». d M M -! f g ^ m. d g (r(0)) 2 \ = d2 (r (0)) g dp 2 g 7 (r(0)) dr 2 I dr dr 2 Entonees resulta la fórmula que relaeiona la longitud de una eireunfereneia eon el radio 129 geodésieo y eon la eurvatura de Gauss introdueida en 9.1.2, eon la salvedad que allí designamos eon r el radio geodésieo que aquí hemos representado por p : TC l c (p) = 2n r (p) = 2np-- p 3 + e c Como en esta eeuaeión > = d g(0), hemos hallado la eurvatura de Gauss de la dr 2 variedad en el punto r = 0 a partir del eoefieiente g(r) de la métriea. Para todas las eireunfereneias geodésieas eon eentro en r = 0 se obtiene la misma fórmula, de modo que en ese punto la eurvatura de la variedad tridimensional se deseribe mediante un únieo esealar. Este método se puede extender para determinar la eurvatura en eualquier otro punto. No obstante, las difieultades del eáleulo no son mueho menores que las implieadas en un abordaje general del problema de la eurvatura, de modo que eonviene analizar este último, eomenzando por resumir el punto de vista de Riemann. Riemann investigó la generalizaeión de la eurvatura de Gauss a una variedad n- dimensional y halló que se podía haeer de la siguiente forma. Se elige el punto P de la variedad en el eual se desea definir la eurvatura intrínseea. Luego se eonsidera la totalidad de las líneas geodésieas que pasan por P. Se eonstruyen las variedades bidimensionales regulares eon las geodésieas que pasan por P. Como estas variedades equivalen a las superfieies de la teoría de Gauss, se les puede haeer eorresponder a eada en el punto P su eurvatura de Gauss. Apliquemos esta idea en un punto P de la variedad 3-D simétriea, distinto del origen O. La geodésiea radial que une O eon P es un eje de simetría, de modo que todas las superfieies geodésieas que eontengan a dieha radial deben poseer la misma eurvatura de Gauss en P. Como vimos en 9.5.3, la superfieie p = efe es una superfieie geodésiea. Como P se earaeteriza por tres eoordenadas r.,6.,p., eligiendo p = p. la eorrespondiente superfieie geodésiea eontiene a la geodésiea radial por P. 129 Conoeida eomo eireunfereneia geodésiea, aunque en general ella misma no es una geodésiea. 160

161 El elemento de línea sobre esta superficie es ds 2 = E(r,6)-dr 2 + G(r,6)-d6 2 con E(r, 6) = S 2 (r) G(r, 6) = r 2. Entonces la curvatura de Gauss en un punto de esta superficie se puede hallar aplicando la fórmula vista en 9.4.1: > (r, 6) = - VE-G d_ ' i dr VE djg dr + - d_ d6 i d/e' V d 2- r dr.s 2 (r) Basta con poner r = r. para obtener en el punto P las curvaturas de todas las superficies geodésicas que pasa por P y contienen a la geodésica radial que une O con P. Ahora lo único que falta es determinar la curvatura de una superficie geodésica normal a la geodésica radial en el punto P. La esfera r = r. es ortogonal en P a dicha geodésica, pero como vimos en 9.5.3, no es una superficie geodésica. Por este motivo la nueva curvatura > 1 que estamos buscando no coincide con la curvatura de Gauss - 1 esfera en el punto P. r. 2 de la En cualquier punto de la variedad distinto del origen > 1 depende solamente del valor de la coordenada radial del punto y verifica 13 : > 1 = 1-1 S 2 (r), Para poder relacionar entre sí las curvaturas de las distintas superficies geodésicas (variedades bidimensionales formadas por geodésicas) que pasan por un mismo punto de V n, Riemann introdujo un tensor de orden cuatro R l, k, - formado a partir de las componentes del tensor métrico y sus derivadas parciales primeras y segundas respecto 131 de las coordenadas (las derivadas segundas aparecen porque es necesario derivar los símbolos de Christoffel). hacerlo, veamos algunos resultados de interés. Posteriormente estudiaremos sus componentes. Antes de Consideremos las componentes covariantes R /; & k del tensor de curvatura. Para cada punto P de V n y para cada par de direcciones por P, dadas por las componentes contravariantes a 1 y b ; de dos vectores en la variedad lineal tangente T n (.), se puede definir una curvatura escalar 132 : > (x 1,: i,b )= 2 R,&k-a l V-b;-b k l, í,&, k=1 2 (S I& < S ;k l & k=1 S Ik - S ) -al -a&-b ; -b k 1!o Ver, por ejemplo, el libro de T. Levi-Civita "T&e absolw/e /éren/jal calcwlws", pp , Blackie & Son, Glasgow, U.K., Conocido como tensor de curvatura de Riemann- Christoffel. 132 Ver, por ejemplo, el libro de D.Lovelock y H.Rund "Tensors, /feren/jal yórrns an var/'a/jonal ^r/'ncjples", pp , Wiley, New York,

162 Esta eurvatura no eambia si los veetores a y b se sustituyen por otros dos, linealmente independientes, obtenidos por eombinaeión lineal de a y b. Como eonseeueneia puede asignarse en el punto P a la superfieie geodésiea V g 2 tangente al 2-plano 2 2 (.) generado por esos veetores. Además, se puede demostrar que eoineide eon la eurvatura Gaussiana de la superfieie V g 2 en el punto P, ealeulada eon los métodos de la geometría difereneial elásiea. Las eomponentes de R i i,1, - se anulan en un punto siempre y euando la variedad sea loealmente plana, en el sentido de que todas las superfieies geodésieas que pasan por el punto posean eurvatura de Gauss nula. Esto oeurre si y solo si existe un sistema de eoordenadas eartesianas (y 1,y 2,...,y") en el eual el elemento de línea se reduee a la n forma ds 2 = e dy 2 donde eada l vale± 1. i=1 A partir del tensor de eurvatura de Riemann- Christoffel, sumando las eomponentes R l n,i, Rieei eonstruyó un tensor de eurvatura simétrieo de orden dos, denominado n tensor de Rieei: R i k = R i z, k,i i=1 La suma de las eomponentes que poseen un índiee eontra-variante y un índiee eovariante iguales se denomina contracción del tensor. A partir del tensor de Rieei, mediante una doble eontraeeión se obtiene una eurvatura esealar R = g 1,k R i k Puede eonsiderarse eomo una espeeie de generalizaeión a una i, k=1 variedad V n de la eurvatura esealar de Gauss. Tanto el tensor de Rieei R z k eomo R apareeen en las eeuaeiones de la gravitaeión de Einstein. Es posible demostrar que un espaeio de Riemann es homogéneo siempre y euando las eomponentes del tensor de eurvatura sean eonstantes y se reduzean al mismo valor esealar en todos los puntos de la variedad: R l i, k, i = R S l z,k, i Siendo S'z,k, i = 1 siempre que i = i = j = k ; y S l i, k, i = 0 en otro easo. Es deeir, la eurvatura, en lugar de venir earaeterizada por un tensor de eurvatura que eambia de un punto a otro, viene earaeterizada por un número, el mismo para todos los puntos. Si R = 0 el espaeio homogéneo posee una geometría intrínseea euelidiana o pseudoeuelidiana. Si R es positivo posee la misma geometría intrínseea que una n-esfera inmersa en un espaeio euelidiano o pseudo-euelidiano. Si R es negativo la geometría intrínseea es del tipo de Lobaehevski. El tensor de eurvatura de Riemann-Christoffel apareee en forma natural euando se efeetúa el transporte paralelo de un veetor sobre una eurva eerrada. 162

163 Si la variedad posee una curvatura intrínseca no nula, el vector que se obtiene por transporte paralelo al regresar al punto inicial es en general distinto al vector con el cual comienza el proceso. La figura 9.7 sugiere lo que ocurre al transportar paralelamente un vector: la parte situada a la izquierda corresponde al desplazamiento sobre una curva cerrada en la superficie de un cilindro (que posee curvatura intrínseca, de Gauss, nula), mientras que la parte situada a la derecha corresponde al desplazamiento sobre una curva cerrada en la superficie de una esfera (que posee curvatura intrínseca positiva). dirección de transporte Figura 9.7 En el caso de la variedad cilindrica el vector que se obtiene en el punto A al finalizar el transporte coincide con el vector inicial v A en dicho punto. Pero para la variedad esférica esos vectores ya no son iguales. Para obtener una expresión matemática de lo que acontece se puede analizar el transporte paralelo de un vector inicial v p sobre un circuito elemental P ^ Q ^ R ^ S ^ P como el que muestra la Figura 9.8. "lis Ar J Ax ] >- - Figura 9.8 n De los resultados deducidos en se desprende la ecuación dv =-^r i,k v' dx k i,k=1 que indica cómo varían las componentes de los vectores en un desplazamiento paralelo infinitesimal. A partir de esta ecuación se puede deducir la siguiente relación para la diferencia en un punto P entre cada una de las componentes del campo vectorial construido a partir de un 163

164 veetor inieial en P luego de un proeeso de transporte paralelo siguiendo un eireuito eerrado O y las eomponentes eorrespondientes del veetor inieial: i i V ftp - Vi dv i = - r i z, k -V 1 -dx k O O i. k=1 La integral eurvilínea dv i se toma sobre el eireuito y se puede igualar a una integral O ordinaria respeeto del parámetro u sobre un intervalo [u 0, w ] euyos extremos eorresponden al punto P en el que eomienza y termina el proeeso de integraeión. En el límite, euando un eireuito eonstruido eomo sugiere la Figura 9.8 se eontrae haeia el punto P, a partir de la integral de línea sobre la eurva eerrada se desprende que: f n > V i ftp - v i p R i i,j,k -v V i=1 Ji --ox k En esta expresión las eomponentes R i, i, - están referidas al punto P, mientras que las eomponentes v son las del veetor inieial v p. Durante el eáleulo se obtiene: dr i i,k Di _ J. -.i j-.m -.i j-.m i, k, ; dr y 1 ' = "T"/ k + m,> U-V UA d - 1 i, k - 1 m, k - 1 J X m=1 m=1 R Este es el tensor de eurvatura de Riemann-Christoffel expresado en términos de los eoefieientes de eonexión de la variedad. Como en se mostró que para las variedades de Riemann los eoefieientes de 1 n f dg dg i dg k ^ eonexión verifieanr y, k = - g 1, i J -j-, resulta que lasr i, i, - son 5x1 2 tt V dx' dx i J funeiones lineales de las derivadas pareiales de orden dos y no lineales de las derivadas pareiales de orden uno y de las eomponentes del tensor métrieo. Debido a las simetrías que presentan los eoefieientes de eonexión y sus derivadas respeeto de las eoordenadas n euando se expresan en funeión del tensor métrieo, el tensor 1 de Rieei R = R i i k,k, i resulta ser simétrieo eon -n - (n +1) eomponentes i=1 independientes y el tensor de eurvatura R i,k,- posee solamente 12-n 2 -(n 2-1) eomponentes independientes. En eomponentes eovariantes: R ykm = -R ;íkm = -R ymk R ykm + R ikm; + R im;k = 0 1 J, k, m = 1 2 v ^ n Si n = 2 el tensor de eurvatura posee solo una eomponente independiente, proporeional a la eurvatura de Gauss. En forma eovariante: R 1212 = -Jg 11 -g 22 - g > Cuando n = 4, que es el easo que interesa en la teoría de la gravitaeión, el tensor de eurvatura posee 20 eomponentes independientes y el tensor de Rieei posee solamente 10. Un punto P de eoordenadas (X 1, X 2,..., X" ) perteneeiente a una variedad riemanniana de dimensión n>2 se diee que es isótropo euando las eurvaturas de Gauss de todas las variedades bidimensionales formadas por geodésieas que pasan por P son iguales. 164

165 Representemos por K(x 1,x 2,...,x") esa curvatura común. Es posible demostrar que cuando esto ocurre, las componentes covariantes del tensor de curvatura verifican: R m = K(x1 % x2,...% x ")- ( g lh S jk - gm g jh ) Si todos los puntos del espacio son isótropos, un teorema debido a Schur afirma que entonces el espacio es homogéneo. La curvatura K es la misma en todos los puntos de la variedad. Un único escalar caracteriza la curvatura en todos los puntos de la variedad. En ese caso mediante un cambio de coordenadas adecuado el elemento de línea se dx, 2 puede llevar a la forma canónica 133 : ds2 = -=1 1 " 1+ 1 K y x 2 4 tr Podemos dar un ejemplo concreto si consideramos nuevamente las variedades simétricas 3-D e investigamos en qué condiciones todos sus puntos son isótropos. Para ello debe verificarse la igualdad de las curvaturas para cada r, es decir: K = -1 r Poniendo h(r ) = g 2 (r) 1 g 2 (r), 1 d 2 r dr 1 g 2 (r). = K y resolviendo la ecuación diferencial resultante, se obtiene h(r) = 1 - C r 2, donde la constante de integración C se puede escribir, sin pérdida de generalidad así: C = donde puede tomar los valores -1,0,1 y r 0 es una constante R O positiva arbitraria. Entonces la componente g rr = g(r) del tensor métrico de la variedad adopta la forma g( r ) = 1 > - r2 r o y Sustituyendo esta función en la expresión para la curvatura de Gauss en un punto resulta que la curvatura es la misma en todos los puntos (es decir, la variedad simétrica 3-D es además de isótropa, homogénea): K = K = ^ ^ 1-1 g 2 (r ) 1 Finalmente, a partir de la representación conforme en E 3 de este tipo de variedad simétrica, que estudiamos en 9.4.6, y pasando ahora a coordenadas cartesianas, el elemento de línea de una variedad 3-D isótropa y por ende homogénea, se puede llevar a í \ la forma canónica: K 1x dx\ + dx 2 3 ) K = 4 I x2 I x3 ) 4 Esta forma, como se verá en el capítulo 12, posee particular importancia en relación con la expresión matemática del postulado de Weyl en el modelo cosmológico estándar. 133 T. Levi-Civita "The absolute differential calculus", capítulo 8, Blackie & Son, Glasgow, U.K.,

166 10. La gravitación y la teoría generalizada de la relatividad " i mes jasado pasé por uno de ios períodos de mi vida más excitantes, absorbentes ai mismo tiempo más ^ructl/eros periodos de mi vida, 'o podía pensar en escribir (cartas^. Comprendí gue mis anteriores ecuaciones de campo para ia gravitación no ten/an una base yirme...habiendo perdido toda con/ianza en ia teoría previa, vi ciaramente gue soio se podría aicanzar una soiución satis/actoria sobre ia base de ia teoría covariante generai, es decir dei (tensor^ covariante de Riemann 4esa/ortunadamente inmortaiicé ios 7itimos errores de este con/iicto en mis artlcuios de ia Academia (Prusiana de Ciencias^ gue pronto enviaré a usted. 7 resuitado yinai es ei ~ a se deben considerar como ia representación naturaide ios "componentes" dei campo gravitatorio. Za cosa espiéndida gue experimenté yue gue no soio ia teoría de Newton se obtiene como una primera aproximación, sino gue además, como segunda aproximación se deduce ia precesión dei peri&eiio de Mercurio (QH R. Za magnitud de ia de/iexión de ia iuz en ei /oi se &ace ei dobie respecto dei vaior anterior. " Albert Einstein en una earta dirigida a Arnold Sommerfeld en noviembre de " i espacio act7a sobre ia materia diciéndoie cómo moverse. A su vez, ia materia reacciona sobre ei espacio, diciéndoio como curvarse " C. Misner, K. Thorne y J. Wheeler "Gravitation" W. Freeman, San Franeiseo, Como la teoría newtoniana de la gravitaeión resulta ineompatible eon la relatividad restringida, resulta natural investigar la posibilidad de eonstruir una teoría relativista de la gravitaeión. Para eompatibilizar la gravitaeión eon la relatividad fue neeesario desarrollar una teoría de la gravitaeión que nos eonduee más allá de la teoría restringida y que, eomo se verá en este eapítulo, elimina la fuerza de atraeeión gravitatoria eomo eausa del movimiento. Esa teoría eonsidera que el movimiento bajo el efeeto de la gravedad se puede interpretar eomo un movimiento libre en un tiempo-espaeio eurvo euya eurvatura depende de la distribueión de la materia en el espaeio. Se apoya en tres prineipios básieos: equivaleneia, eovarianeia y eonsisteneia. Su formulaeión requirió un tipo de espaeio abstraeto más general que el de Minkowski y el empleo de herramientas matemátieas más generales que las utilizadas en la teoría restringida: las variedades pseudo-riemannianas y el análisis mediante tensores resumidos en el eapítulo preeedente El principio de equivalencia En una earta a R. W. Lawson en enero de 1920, Einstein le euenta que en 1907, mientras trabajaba sobre la forma de ineorporar la teoría newtoniana de la gravitaeión a 166

167 la teoría de la relatividad, se puso a pensar en las impresiones que experimentaría una persona que cae desde un tejado. En la medida en que continúe cayendo, para él el campo gravitatorio de la Tierra no existiría: si "dejase caer" objetos de su bolsillo, éstos o bien permanecerían en reposo o en movimiento uniforme respecto del observador en caída libre. Entonces se le ocurrió hacer la siguiente conjetura: durante un período breve de tiempo, las leyes de la física en un pequeño laboratorio en caída libre son las mismas que en ese mismo laboratorio pequeño fijo a un marco inercial en ausencia de campo gravitatorio. Posteriormente analizó qué ocurriría si al laboratorio se le imponía una aceleración constante. Los objetos "caerían" con la misma aceleración pero en sentido opuesto. Como la masa gravitatoria y la inercial son iguales, desde adentro del laboratorio la situación no sería indistinguible de la de ese mismo laboratorio fijo a un marco inercial en el que existiera un campo gravitatorio cuya aceleración de gravedad tuviera la misma magnitud de la aceleración impuesta pero sentido opuesto. Así pues, la reflexión sobre la igualdad entre masa gravitacional y masa inercial, condujo a Einstein a plantear la equivalencia local entre un sistema de referencia no inercial y un campo gravitatorio. En una región del espacio lo bastante pequeña como para que allí el campo gravitatorio se pueda considerar uniforme, es posible eliminarlo sustituyéndolo por un sistema uniformemente acelerado cuya aceleración sería igual a la que adquiriría una partícula situada en la región de campo gravitatorio considerada. Localmente en el tiempo y en el espacio, un sistema acelerado puede aproximarse por uno inercial que, por así decirlo, le es "tangente". Consideremos todo esto con más detenimiento, comenzando con dos observadores P y P' fijos a un cuerpo que se mueve con un movimiento rectilíneo uniformemente acelerado respecto de un marco inercial K. El segmento de recta que une P con P' es paralelo a la dirección del movimiento. La distancia que separa los puntos mencionados es l 0 y la aceleración que posee el cuerpo (y por ende, que poseen ambos puntos) es a. Los observadores llevan relojes iguales, sincronizados como se explicó en 6.1. Podría tratarse de relojes de Cesio. Definimos la frecuencia de una oscilación en un determinado sitio, P o P', comparándola con la del reloj local allí situado. Supongamos que P' marcha delante de P y que P' envía un tren de luz monocromática hacia P, proveniente de su reloj atómico. La frecuencia del tren en P' es f (P '). En el marco de referencia del cuerpo acelerado Ñ, esa señal tarda un intervalo de tiempo 1 0 A t = en ir de P' hasta P. c En el momento en el que la señal partió de P', el cuerpo poseía una velocidad v respecto de K. Introduzcamos un marco inercial K' que se mueve con esa velocidad respecto de K. Entonces tanto P como P' se encuentran en reposo respecto de K' en el instante en el 167

168 que se emite el tren. Luego de un intervalo de tiempo A t la veloeidad de Ñ y la de los / o puntos P y P' fijos a él, se habrá inerementado en a A t = a.. Como c eonseeueneia, euando es aleanzado por la señal proveniente de P', el punto P poseerá / o una veloeidad A v = a. respeeto del mareo inereial K'. c De aeuerdo eon lo visto en 7.4.1, el observador en P reeibirá la señal eon una freeueneia \ f (.) /c + A v f (P ) aumentada por el faetor Doppler 7 r = -/. f (P ') V c - A v El reloj ubieado en P' pareeerá adelantar (es deeir, pareeerá oseilar más rápido) respeeto del reloj en P. Si ahora enviamos una señal luminosa de P haeia P', el eorrimiento Doppler en la señal será opuesto. La freeueneia reeibida en P' vendrá disminuida por un faetor respeeto de f (P ') lc - A v la freeueneia de la señal emitida en P: 7 7 =../ f (P ) Vc + A v El faetor Doppler se puede expresar así en funeión de la aeeleraeión del euerpo y de la c + A v A v a-/ o distaneia entre los puntos P y P':../ ~ 1 + = P y V c - A v c c 2 Supongamos ahora que el euerpo Ñ es hueeo y en su interior se ha heeho vaeío. Cualquier objeto que se libere allí dejará de estar aeelerado y eaerá haeia atrás, es deeir en sentido desde P' haeia P. Un observador fijo a la eápsula vería que el objeto presenta una aeeleraeión - a dirigida de P' haeia P, opuesta al sentido del movimiento. Einstein se dio euenta de que este movimiento de los objetos podría deberse también a la atraeeión gravitatoria debida a un planeta sobre el eual se eneontrara apoyada la parte posterior de la eápsula 134. Esto se verifiearía siempre y euando la masa gravitaeional y la masa inereial de eada objeto fueran iguales y si la aeeleraeión de la gravedad debida al planeta es g = -a 135. A partir de este análisis, se puede eonjeturar el principio de equivalencia: un eampo gravitatorio uniforme es equivalente en todos los aspeetos a un mareo de refereneia aeelerado Ñ. Si aplieamos este prineipio a la eápsula, entre el punto P' y el punto P y si suponemos que es loealmente válida la teoría esealar de la gravitaeión (teoría newtoniana) entonees debe haber una difereneia de poteneial gravitatorio c(p ' )-p(p )= - g -/ o = a -/o 134 Y por tanto la totalidad de la eápsula se eneontraría en reposo respeeto del hipotétieo planeta. 135 g se dirige en sentido opuesto a a, por lo eual g es un número negativo. 168

169 C f (. ) \c + A v c + AV, a 1 Como t r =../ v J «1 + 0 resulta que f (P') Mc - A v \ c - A v c 2 4 f (P ) w 1, (y(p')-y(p )) Obien. / (P')- / (P ).. (p(p')-p(p )) f (P') c 2 / (P') c 2 Consideremos dos puntos con diferente potencial gravitatorio. Entonces un átomo excitado situado en el punto donde el potencial gravitatorio es menor emite líneas espectrales desplazadas al rojo respecto de un átomo de la misma clase pero situado en el otro punto. Esto suministra un fundamento, basado en el principio de equivalencia, a las consideraciones efectuadas en 8.3. De acuerdo con la teoría restringida de la relatividad, no habría motivo para suponer que dos relojes idénticos en reposo relativo puedan presentar una diferencia en su período de oscilación. Ahora vemos que esa diferencia debe esperarse cuando ambos relojes se encuentran fijos a un cuerpo acelerado o cuando ambos se encuentran a diferente potencial gravitatorio. La proporcionalidad (que puede transformarse en una igualdad utilizando unidades adecuadas) entre la masa inercial y la masa gravitatoria es sorprendente: a priori parece que no hubiera una razón por la cual tendrían que estar relacionadas. Al fin y al cabo, la masa inercial es el coeficiente de resistencia a la aceleración de un cuerpo en la formulación matemática de las leyes de la dinámica, mientras que la masa gravitatoria es un análogo de la carga en el caso eléctrico, puesto que es el coeficiente de acoplamiento del cuerpo al campo gravitatorio 136. Mientras que el movimiento de una partícula cargada en un campo electromagnético depende de dos parámetros independientes, su masa inercial y su carga eléctrica (que es su coeficiente de acoplamiento al campo), en un campo gravitatorio la igualdad entre la masa inercial y la masa gravitatoria elimina la masa del cuerpo de las ecuaciones del movimiento: dos cuerpos con las mismas condiciones iniciales se mueven igual, sea cual sea la diferencia entre sus masas. El principio de equivalencia puede formularse en dos versiones. Una débil, planteada por Einstein en 1907, suficiente para plantear una teoría de la gravitación: "En el interior de una región lo bastante localizada del tiempo-espacio, adyacente a una concentración de masas, el movimiento de los cuerpos sometidos exclusivamente a efectos gravitatorios no puede ser distinguido por vía de un experimento, cualquiera que sea, del movimiento de los cuerpos en el interior de una región con una aceleración uniforme adecuada". Se sobre-entiende que se trata de lo que en física se denominan 136 Es posible distinguir dos masas gravitatorias asignables a un cuerpo: la masa considerada como carga pasiva m g cp que determina la fuerza que un campo gravitatorio ejerce sobre ese cuerpo, y la masa considerada como carga activa m g ca que determina el campo gravitatorio generado por el cuerpo. La igualdad m gcp = m gca de ambas masas gravitatorias es necesaria para la igualdad de las fuerzas gravitatorias de interacción entre dos cuerpos. Sobre esta distinción y sus consecuencias ver D. Ivanenko y G. Sardanashvili "Gravitación", capítulo 2, Editorial URSS, Moscú,

170 euerpos de prueba, o sea en este easo euerpos tales que no modifiean signifieativamente el eampo gravitatorio del lugar donde se eneuentran. Una fuerte, planteado posteriormente y que abarea, además de las interaeeiones gravitatorias, las interaeeiones eleetromagnétieas y las interaeeiones nueleares: "En el interior de una región lo bastante loealizada del tiempo-espaeio, adyaeente a una eoneentraeión de masas, el eomportamiento físieo de los euerpos no puede ser distinguido por vía de un experimento, eualquiera que sea, del eomportamiento físieo de los euerpos en el interior de una región eon una aeeleraeión uniforme adeeuada". La versión fuerte impliea la débil, pero la débil podría permaneeer válida aunque la versión fuerte debiera ser deseartada. Algunas eonseeueneias de ambas versiones han sido eonfrontadas eon resultados experimentales y hasta el momento pareeen bien eonfirmadas. 12 Las eonfirmaeiones más preeisas de la forma débil (a menos de una parte en 10 ) se obtuvieron en experimentos destinados a eomparar las aeeleraeiones de la Tierra y de la Luna en el eampo de gravitaeión del Sol, efeetuados a fines del siglo XX y 18 eomienzos del aetual. Se espera una eonfirmaeión eon una preeisión de una parte en 10 euando se pueda llevar a eabo una misión espaeial diseñada a tal efeeto (Satellite Test of the Equivalenee Prineiple, STEP). Los experimentos para eonfrontar la forma fuerte son más difíeiles de llevar a eabo y en general resultan más ambiguos: se foealizan en determinar una posible variaeión de la eonstante gravitatoria G eon el paso del tiempo, sobre la base de que la mayor parte de las teorías de la gravitaeión alternativas a la de Einstein, que violan la forma fuerte del prineipio predieen valores loeales de dieha eonstante variables. La eonstaneia de G 13 pareee eonfirmada a menos de una parte en 10 por año El tiempo-espacio-materia y la gravitación La meeániea elásiea separa el espaeio del tiempo. Asume la homogeneidad e isotropía del espaeio, asimilándolo al modelo euelidiano. Define invariantes bajo traslaeiones y rotaeiones en el espaeio tridimensional que eondueen a las leyes de eonservaeión de la eantidad de movimiento lineal y angular en los sistemas meeánieos. Por otro lado deseribe la homogeneidad del tiempo y deseribe invariantes bajo una traslaeión en el tiempo que eondueen a la ley de eonservaeión de la energía. La eonexión entre espaeio y tiempo se realiza en las transformaeiones de Galileo: el tiempo permaneee ineambiado al pasar de un mareo de refereneia inereial a otro, pero las eoordenadas espaeiales se modifiean euando los mareos se hallan en movimiento relativo. Interesan las propiedades que permaneeen invariantes bajo el grupo de transformaeiones de Galileo, porque eorresponden a los mismos proeesos deseriptos por diferentes observadores ubieados en distintos mareos inereiales: el aspeeto objetivo de la realidad según la físiea newtoniana. La teoría restringida de la relatividad introduee un eontinuo tiempo-espaeio tetradimensional, el espaeio no euelidiano de Minkowski, eon una pseudo-métriea definida 170

171 mediante el denominado intervalo entre eventos. Asume la homogeneidad e isotropía del espaeio de Minkowski, lo que se manifiesta en la invarianeia del intervalo bajo el grupo de transformaeiones de Lorentz. Interesan las propiedades que permaneeen invariantes bajo el grupo de transformaeiones de Lorentz porque eorresponden a los mismos proeesos deseriptos por diferentes observadores situados en diferentes mareos inereiales: el nuevo aspeeto objetivo de la realidad según la físiea relativista, que sustituye a la objetividad asumida en la físiea newtoniana. La teoría generalizada de la relatividad elimina la restrieeión a los mareos inereiales. Los mareos de refereneia pueden ser eualesquiera en movimiento relativo arbitrario. Lo únieo que se asume es que todo evento se puede deseribir mediante una euaterna de ( \ ) (números reales) respeeto de un mareo K y que sus eoordenadas respeeto de otro mareo K' vienen dadas por transformaeiones puntuales regulares e invertibles X,J = f J (X 0,X 1,X 2,X 3 ) para j=0, 1, 2, 3. En prineipio, aunque en la práetiea no se haga, un mareo de refereneia podría eonsistir en euatro aviones volando de eualquier forma. Las euatro eoordenadas del evento podrían ser los instantes de tiempo en los que una señal proeedente del evento es registrada por eada uno de los euatro aviones. Ese tiempo podría ser registrado por un reloj no newtoniano (ver 2.1). Pero en la formulaeión de la teoría de la gravitaeión, tal eomo se lleva a eabo en la práetiea, se utilizan tres eoordenadas asoeiadas eon el espaeio físieo X 1, X 2, X 3 y una eoordenada X 0 asoeiada eon el tiempo. Ahora interesan en prineipio las propiedades que permaneeen invariantes bajo el grupo formado x'> = f 1 (x 0 por, X 1, Xtodas 2, X 3 ). las transformaeiones puntuales regulares e invertibles En eonseeueneia todos los marcos de referencia se deberían poder utilizar en una deseripeión de los eventos del mundo físieo, ya no solo los mareos inereiales. Apareee un nuevo aspeeto objetivo de la realidad según la relatividad generalizada, que debe sustituir a la objetividad asumida en la teoría restringida, eomo la objetividad de esta última sustituyó a la objetividad de la físiea newtoniana. Con la generalizaeión del prineipio de relatividad a mareos de refereneia arbitrarios se puede llevar a eabo el programa planteado por Maeh: eliminar el último vestigio de earáeter absoluto en el tiempo y en el espaeio, transformándolos en meros medios para la deseripeión de los fenómenos físieos. Pero mientras que Maeh insistió siempre en los aspeetos relativos del espaeio y el tiempo 137, Einstein se dispuso a eneontrar las relaeiones espaeio-temporales que 137 La importaneia que Ernst Maeh dio a la relatividad del espaeio y del tiempo le impidió dar una respuesta positiva al programa que el mismo había planteado. Siempre se opuso a la respuesta positiva de Einstein frente a ese programa, es deeir, a la teoría de la relatividad. Resulta interesante que, por motivos muy similares, Maeh también se oponía a las teorías que postulaban átomos que no eran observables. Ya haeia el final de sus días, algunas personas le mostraron los 171

172 permanecían invariantes bajo el grupo de todas las transformaciones puntuales: salió a la caza de nuevos absolutos. Para cumplir este programa se pueden utilizar como guía dos principios: el principio general de covariancia y el principio general de consistencia Covariancia El principio general de covariancia es la máxima extensión posible del principio de relatividad: las leyes de la física deben adoptar la misma forma en todos los marcos de referencia. Einstein concretó este principio en un requerimiento sobre las ecuaciones que expresan leyes físicas: deben mantener su forma bajo una amplia clase de transformaciones de coordenadas de tiempo y espacio. Pudo satisfacer este requerimiento de invariancia (denominado covariancia generalizada) recurriendo a formular las ecuaciones de la física en forma de igualdades entre tensores involucrando las diversas operaciones algebraicas, contracción de índices y derivación covariante, resumidos en la parte 9.5. Para expresar matemáticamente la idea de que el movimiento debido exclusivamente a los efectos de la gravitación es un movimiento libre en un espacio curvo cuya curvatura depende de la distribución de la masa-energía, es necesario comenzar por la variedad que corresponde al tiempo-espacio. En particular el intervalo ds 2, si es una generalización del invariante que se encuentra en la base de la teoría restringida, debe corresponder a una pseudo-métrica en la variedad formada por el tiempo-espacio-materia. Entonces debe permanecer invariante bajo la clase de transformaciones de coordenadas que presumiblemente conectan las coordenadas de un mismo evento cuando es observado desde diferentes marcos de referencia. La expresión local del intervalo que corresponde a un continuo tiempo-espacio se 3 expresa así: ds 2 = ^ g k dx 1 dx k donde los índices i,k se suman sobre los números i,k=0 naturales entre 0 y 3, representando con 0 la coordenada temporal en unidades de longitud x 0 = c t y con los demás números las coordenadas espaciales. Los símbolos g i k varían por lo general de un punto a otro del tiempo-espacio y forman el tensor métrico que determinan la pseudo-métrica local de una variedad tetra-dimensional. Para que ds 2 posea dimensiones de cuadrado de una longitud, las componentes g i k del tensor métrico deben ser no dimensionales. La forma de variación de estas componentes, de un punto a otro, determina el valor local del tensor de curvatura del 138 continuo tiempo-espacio-materia y también las ecuaciones de las geodésicas (que corresponden al movimiento libre), como se explicó en 9.5. fenómenos que se interpretan como impactos (sobre pantallas fluorescentes) de partículas provenientes de desintegraciones radioactivas. 138 Como se puso en evidencia a lo largo del capítulo 9, para medir la curvatura local de una variedad es suficiente efectuar mediciones desde adentro. No es necesario imaginar un espacio euclidiano de mayor dimensión en el interior del cual ese continuo se encuentra inmerso, en forma análoga a como una superficie curvada bidimensional se encuentra inmersa en el espacio euclidiano tridimensional que nos es familiar. Pero si se prefiere imaginar el mundo tetra-dimensional curvado y embebido en un espacio euclidiano, éste debe tener 10 dimensiones de acuerdo con la fórmula vista en la sección

173 En eonseeueneia, el primer objetivo de la teoría debe ser hallar eeuaeiones que permitan determinar las eomponentes del eampo tensorial g i k en funeión de la distribueión de la materia. Para hallarlas se dispone de una guía que suministra el prineipio de eonsisteneia Consistencia y tanteos preliminares El prineipio de eonsisteneia, eomo vimos a propósito del easo de la teoría restringida y la meeániea newtoniana al eomienzo de 8.1, puede resumirse en el siguiente requerimiento: toda teoría que aspire a sustituir a otra debe dar euenta de las predieeiones exitosas de las teorías previas. En el easo de la teoría generalizada, esto impliea que debe ser eonsistente tanto eon la teoría restringida eomo eon la gravitaeión newtoniana euando estas últimas resulten aplieables. La eonsisteneia eon la teoría restringida impone un primer tipo de restrieeión sobre la naturaleza del eontinuo tiempo-espaeio-materia. Esta restrieeión se puede hallar a partir de la idea de que los efeetos gravitatorios equivalen a una eurvatura de ese eontinuo. Si la eurvatura desapareee, desapareeen esos efeetos y deberíamos esperar que al enderezarse el tiempo-espaeio-materia se transforme en un tiempo-espaeio de Minkowski. Pero es posible avanzar más en esta direeeión. Considerando al tiempo-espaeio-materia eomo una variedad regular eurvada euyos puntos son eventos, en eada punto P del se define una variedad lineal tangente. La variedad tangente posee el mismo número de dimensiones (4) que la variedad eurvada, pero su eurvatura es en todas partes nula. No obstante en un entorno lo bastante pequeño de un evento P 0, la variedad de Riemann se puede aproximar por su variedad tangente eon un error que es un infinitésimo de orden superior al de las difereneias de eoordenadas de tiempo y espaeio entre los puntos P de ese entorno y P 0. Cuando se fijan las eomponentes del tensor métrieo en el valor g i k (. 0 ) que poseen en 3 P 0, el elemento de línea resultante ds 2 = g i k (. 0 ) dx -dx k no es otra eosa que la i, k=0 pseudo-métriea euelidiana sobre la variedad lineal tangente. Esta es plana y deberíamos esperar que fuera un espaeio de Minkowski. Así pues la eonsisteneia eon la relatividad restringida exige que la variedad que representa el eontinuo tiempo-espaeio-materia se pueda aproximar loealmente en eada uno de sus puntos por un tiempo-espaeio de Minkowski tangente, y se transforme en un únieo tiempo-espaeio de Minkowski si los efeetos gravitatorios desapareeen en todas partes. Por otra parte las eeuaeiones que en la teoría restringida expresan leyes físieas eomo las del eleetromagnetismo, que no se redueen a efeetos gravitatorios, deben eonstituir aproximaeiones loeales a las eorrespondientes eeuaeiones de la teoría generalizada. Desde el punto de vista físieo todo esto se puede resumir dieiendo que todos los resultados de la teoría restringida se deberían verifiear eomo aproximaeiones loeales en la teoría generalizada. 173

174 Para ver qué tipo de restricción se desprende de la consistencia con la teoría de la gravitación de Newton, es necesario replantear esta teoría en términos de campos. Este replanteo se llevó a cabo en lo fundamental durante el siglo XIX, y se puede resumir en una relación entre el potencial gravitatorio q(t, r) y la densidad de materia p(t,r) de la teoría newtoniana en la forma de ecuación a derivadas parciales, debida a Poisson: d 2 q(t,r) d 2 q(t,r) d 2! q(t,r) _ ^ +! + ; v! 2' = 4n G p(t,r) dx dy dz El operador A (el operador de Laplace) está formado por las derivadas parciales de segundo orden respecto de las coordenadas espaciales y G es la constante de gravitación de Newton. La densidad de masa constituye la fuente del campo gravitatorio, que en cada punto y en cada instante viene dado por el vector g(t,r) = -Vq(t,r) de componentes cartesianas dq dq dq, y. dx dy dz Como, a diferencia de lo que acontece en la ecuación de ondas clásica, en la ecuación de Poisson solo aparecen derivadas respecto a las coordenadas espaciales, pero no respecto del tiempo, la propagación del efecto de una variación temporal en la densidad sobre el potencial, y por ende sobre el campo gravitatorio, se produce en forma instantánea. Ya en sus primeros trabajos de 1904, 1905 y 1906 sobre la teoría restringida, Poincaré insistió en la universalidad del principio de relatividad y propuso su extensión a las interacciones gravitatorias. Asumiendo una velocidad finita de propagación de las interacciones gravitatorias, igual a la velocidad de la luz introdujo un retardo en la formulación de la ley de atracción. Esta forma de abordar el problema no resultó adecuada. En el período comprendido entre la aparición de los trabajos pioneros de Poincaré y los trabajos fundacionales de Hilbert y de Einstein en 1915 y 1916 sobre las ecuaciones de la teoría generalizada, varios investigadores, entre ellos Minkowski, Abraham, Nordstrom y Einstein mismo, intentaron construir teorías escalares de la gravitación. En líneas generales estas teorías buscaban una generalización de la ecuación de Poisson 139 Aq = 4n G p en el marco de la relatividad restringida y aplicando el principio de consistencia. Si se supone que el potencial escalar y la densidad de masa son invariantes relativistas, una generalización inmediata que resulta compatible con el principio de relatividad restringido es la siguiente ecuación de ondas clásica para el potencial gravitatorio 140 : dx 2 + ay 2 + dz 2 c 2 at 2 p0 139 En coordenadas cartesianas el operador de Laplace A se expresa así: Aq= d q + d q + d q 140 Esta ecuación conduce a predecir la existencia de ondas gravitacionales. dx 2 dy 2 dz 2 174

175 En el término 4n- G- p 0, fuente del eampo esealar (p(t; x,_y,z), apareee la densidad de masa en reposo p 0 (/; x,_y,z). No obstante todos los esfuerzos realizados, euando se eonfrontaron eon los heehos físieos, las teorías esealares fraeasaron. La masa relativista total, y no solo la masa en reposo, pareeían ser la fuente de las interaeeiones gravitatorias, de modo que las eontribueiones asoeiadas eon la veloeidad de movimiento de la materia debían ser tenidas en euenta. Así el siguiente paso eonsistió en intentar introdueir un euadripoteneial gravitatorio euyas fuentes se eneontraran en el euadriveetor energía-eantidad de movimiento. Pero los esfuerzos realizados en este sentido también fraeasaron, entre otros motivos debido a que el término fuente de los efeetos de gravitaeión no se podía representar eomo un euadriveetor. Todo apuntaba a pensar que se requerían objetos matemátieos más eomplejos, tanto para representar las fuentes del eampo eomo para representar el eampo mismo. La earaeterizaeión del movimiento, por lo demás libre, de una partíeula newtoniana restringida a moverse en una superfieie, estudiado en la parte 9.3, pareeía sugerir una salida de este impasse. Este fue el eamino finalmente seguido por Einstein y por Hilbert para formular las eeuaeiones de una teoría relativista de la gravitaeión, utilizando el tensor métrieo eomo expresión del eampo gravitatorio, el tensor de energía impulsión eomo expresión de las fuentes del eampo y las eeuaeiones de las geodésieas eomo eeuaeiones del movimiento por efeeto de la gravedad Las ecuaciones del campo gravitatorio Para formular las eeuaeiones del eampo gravitatorio en preseneia de materia-energía (partíeulas masivas y radiaeión) Einstein eomenzó de nuevo eon la eeuaeión de Poisson de la teoría newtoniana de la gravitaeión: Ap = 4n G p Utilizándola eomo guía, sustituyó la densidad de masa p por una versión generalizada del tensor de energía-impulsión 2 i,k (i,k = 0,1, 2, 3) visto ya (en una versión restringida) en la parte 8.7 a propósito de la dinámiea de fluidos. Es un tensor simétrieo de orden dos que deseribe la distribueión y el flujo de energía y eantidad de movimiento de la materia y de la radiaeión en un lugar del eontinuo tiempo-espaeio-materia. Este tensor se debería relaeionar eon el eampo gravitatorio de tal manera que se asegurara la validez del prineipio de eonservaeión de la energía-eantidad de movimiento. En la teoría restringida de la relatividad este prineipio únieo sustituye a los tres prineipios fundamentales de eonservaeión de la masa, la energía y la eantidad de movimiento de la físiea elásiea 141. Como vimos al final de la seeeión 9.4.2, efeetuando una eontraeeión de índiees a partir de la derivada eovariante de un tensor eserito en forma eontravariante obtenemos el tensor denominado divergencia covariante. En la parte 8.7 vimos su aplieaeión a la meeániea de un fluido ideal en el tiempo-espaeio de Minkowski. En este easo, en el eual la variedad se plana, la divergeneia eovariante se reduee a la euadridivergeneia vista en

176 La expresión matemátiea que generaliza el prineipio de eonservaeión de la energíaeantidad de movimiento en una variedad riemanniana es la anulaeión de la divergeneia 3 eovariante del tensor de energía-impulsión: En su búsqueda de la expresión que estaría destinada a sustituir a Ap, Einstein tuvo en euenta que para tener el mismo orden y simetría que el tensor de energía-impulsión debería ser un tensor de orden dos, simétrieo. Para poder expresar la identidad presumida entre los efeetos gravitatorios y la eurvatura de la variedad tiempo-espaeio, ese tensor destinado a sustituir a Ap debería estar eonstruido a partir del tensor métrieo. El tensor de eurvatura depende de los eoefieientes de eonexión de Riemann-Christoffel,, _ Oi dr i i,k Oi dr i ij eomo se mostró en 9.5.4: E i i,k, ; = V ^ + V r l m, ; r - V rv k r" k ^ X 1 ax*...,..., Los eoefieientes de eonexión se expresan a su vez en términos de las eomponentes del tensor métrieo y de sus derivadas pareiales respeeto de la eoordenada temporal y las tres 1 ^,i fd gi, k, d g,-, i d A g eoordenadas espaeiales: rv k = g hi - + J -j- Como desapareeen 2 i= ^ dx ; dx dx y si las eomponentes del tensor métrieo no varían de un punto a otro, Einstein eonjeturó que en el tensor que se buseaba deberían apareeer las derivadas pareiales de esas eomponentes respeeto de las eoordenadas. Cabía esperar que apareeieran derivadas pareiales de eomponentes g i k hasta el segundo orden, puesto que hasta ese orden apareeen en la deseripeión de la eurvatura de las variedades. En ese easo el tensor métrieo oeuparía en la nueva teoría de la gravitaeión el lugar que oeupa del poteneial newtoniano en la teoría antigua. Como diee Einstein en la earta a Sommerfeld que apareee al eomienzo de este eapítulo, los eoefieientes V-oeuparían a su vez el lugar del veetor que representa al eampo gravitatorio en la teoría de Newton. Por analogía eon Ap, supuso que el tensor que se buseaba sería lineal y homogéneo en términos de las derivadas pareiales de segundo orden. Además, tuvo en euenta que la divergeneia eovariante eorrespondiente al término tensorial destinado a sustituir a Ap en el lado izquierdo de la eeuaeión, debería anularse 142. A partir de todos estos requisitos eonjeturó que en el miembro de la izquierda de la eeuaeión se podría eneontrar el tensor de Rieei 143 E 1, k y el tensor métrieo g 1 ' k en una eombinaeión tal que su divergeneia eovariante resultara ser siempre nula. i=0 i = Ver, por ejemplo, el eapítulo 11 (eeuaeiones del eampo de gravitaeión) del libro de L. Landau y E. Lifehitz "Teoría del eampo", Reverté, Barcelona, El tensor de Rieei en su forma dos veees eovariante E i k se obtiene por eontraeeión de índiees en el tensor de eurvatura de la variedad de Riemann que representa al eontinuo tiempo-espaeio y posterior. La forma dos veees eontravariante E i,k se obtiene por elevaeión de índiees empleando la forma eontravariante g^k del tensor métrieo, eomo se explieó en la seeeión

177 La combinación más simple que verifica todas estas restricciones es el tensor de Einstein G', 1 = R u 1-1 g', 1 R 2 En esta expresión el coeficiente 2 asegura que se verifique la condición de divergencia 3 covariante nula: ^D l G 1,l = 0 y la curvatura escalar R se define a partir del tensor de l =0 Ricci como se mostró en 9.5.4: R = ^g' 1 ' R, 1 n ' 1=1 Finalmente, Einstein propuso las siguientes ecuaciones para el campo gravitatorio: G', 1 = R', 1-1 g', 1 R = _r 2', 1 i,1 = 0, 1, 2, 3 2 8n La constante, r = G es proporcional a la constante de gravitación de Newton G. c Conocida como constante de gravitación de Einstein, multiplica al tensor T hk garantiza la consistencia con la teoría newtoniana de la gravitación. Como el tensor de curvatura de Ricci se forma a partir de las componentes del tensor métrico y de sus derivadas, el miembro de la izquierda de la ecuación, es decir, el tensor de Einstein G 1 ' 1, depende solamente del tensor que representa las propiedades métricas del tiempo-espacio. El miembro de la derecha presenta el tensor T 1 asociado, como ya dijimos, a las propiedades de la distribución de la materia (incluyendo el campo electromagnético) que constituyen las fuentes del campo gravitatorio: "representa la energía que engendra el campo gravitatorio; pero es en sí misma, de carácter no gravitatorio, como sucede por ejemplo con la energía del campo electromagnético, de la densidad de la materia ponderable, etc. Para representar este tensor T i 1 se utilizan conceptos de Física prerelativista que sólo a posteriori se han adaptado al principio de relatividad general.' 144 Estas ecuaciones de campo, junto con condiciones de borde adecuadas, permiten determinar las componentes del tensor métrico en cada punto del continuo tiempoespacio, suponiendo que se supone conocido el tensor energía-impulsión. La simetría de los tensores involucrados en las ecuaciones de campo tiene como consecuencia una disminución en el número de ecuaciones independientes de 16 a 10, lo cual permite hallar las 10 componentes independientes del tensor simétrico en su forma covariante g i 1 o, en su forma contravariante equivalente g' Para que una región de una variedad pueda considerarse plana, deben anularse las componentes del tensor de curvatura R 1 Í,k,- 1. en todos sus puntos. Esto implica que el tensor de Ricci R' 1 se anula en esos puntos. Pero debido a como se lo define y A. Einstein "El significado de la relatividad', 2 a edición, Espasa Calpe Argentina, Buenos Aires, 1952, Apéndice II. 177

178 (E k = R l t,k,i) de la anulación del tensor de Ricci no se desprende que el tiempol=1 espacio sea plano, o sea que R l, i,- sea nulo. Si el tensor de Ricci es nulo, entonces debe anularse el tensor de energía-impulsión en ese punto: hay vacío en lugar de radiación o partículas. Aplicando la operación de descenso de índices de un tensor, la ecuación de Einstein para el campo gravitatorio se puede escribir también con todos los tensores en forma c v ariante: E, k - 2 g,-k R = - K 2k i,k = 0 1 %2, 3 Es posible demostrar 145 que la ecuación R. k g i k R = -K 2 k es equivalente a la e c u a c i ó n E i k = - K ( ^ - 2 ) 3 Por definición, el escalar 2 = 2 l i se construye por contracción de índices a partir de l =0 3 la forma mixta 2! ;- = g h k 2 k. del tensor de energía-impulsión. k=0 De R. k = -K ^r2 i k - 2 g. k 2jj se desprende que si en un punto se anula el tensor de energía-impulsión, o sea si en ese punto hay vacío, entonces en ese punto también se anula el tensor de Ricci. Por tanto la anulación del tensor de Ricci en un punto equivale a que en ese punto hay vacío, y justifica la denominación "soluciones en el vacío" con que se conocen las soluciones de la ecuación tensorial R. k = 0 (o de su ecuación equivalente R 1 ' k = 0). En una aproximación de campo gravitatorio débil, se obtienen soluciones de vacío en forma de ondas de gravitación que viajan con la velocidad de la luz y que pueden estar localizadas en regiones acotadas del espacio físico. La teoría generalizada muestra que esas ondas se pueden generar por radiación a partir de las masas en movimiento de un sistema de cuerpos materiales, localizado en una región acotada. La pérdida de energía que esta radiación conlleva es lo bastante pequeña como para que su efecto sobre el movimiento de las masas no sea significativo, al parecer ni siquiera en el caso de objetos a escala astronómica ni a una escala de tiempo cósmica La demostración puede verse, entre otras fuentes, en R. Lambourne, "Rela/ivi/y, gravita/ion and cosmology", p. 294, Cambridge University Press, U.K No obstante, se ha podido obtener evidencia indirecta sobre las ondas de gravitación. Esta evidencia se basa en haber observado durante 30 años la disminución del período orbital de un pulsar binario conocido como PSR B Al parecer estaría formado por dos estrellas de neutrones (las estrellas de neutrones se consideran más adelante en la sección ), una de las cuales gira sobre sí misma unas 17 veces por segundo y emite pulsos regulares de radiación electromagnética que se pueden detectar en nuestro planeta. Las modificaciones de esta señal permiten inferir la variación en el período de rotación, estimado en 7.75 horas para estrellas de masas próximas a 1.4 veces la masa solar. El desacuerdo entre lo observado y lo que predice la teoría generalizada suponiendo que el efecto se debe en última instancia a la radiación de ondas de gravitación es de solo un 0.2 %. Sobre ondas gravitacionales y su evidencia observacional, ver por ejemplo, R. Lambourne, "Rela/ivi/y, gravi/a/ion and cosmology", pp , Cambridge University Press, U.K

179 La ley del movimiento en un campo gravitatorio En la formulación de 1915 y 1916 de la teoría de la gravitación, Einstein agregó un postulado adicional: "Los cuerpos, en presencia solo de un campo gravitatorio, se mueven a lo largo de geodésicas en el tiempo-espacio curvado". Se reduce en última instancia la gravitación a la curvatura del espacio. Las líneas geodésicas en el tiempo-espacio-materia se pueden clasificar en tres tipos: 3 El tipo temporaloide caracterizado porque el intervalo ds 2 = ^ gi 1' dx 1 dx k es siempre positivo a lo largo de la curva. 3 El tipo espacialoide caracterizado porque el intervalo ds 2 = ^ gi 1 dx 1 dx k es siempre negativo a lo largo de la curva. 3 El tipo nulo caracterizado porque el intervalo ds 2 = ^ gi 1 dx 1 dx k es siempre nulo a lo largo de la curva. El postulado introducido por Einstein se puede concretar un poco más en un principio de movimiento geodésico: "Las líneas geodésicas temporaloides representan líneas de universo posibles para partículas con masa en reposo no nula que caen libremente bajo la sola influencia de la gravedad. Las geodésicas nulas representan líneas de universo posibles para partículas cuya masa en reposo es nula y que se mueven bajo la sola influencia de la gravitación." Así pues, bajo el solo efecto del campo gravitatorio un planeta orbita en torno al sol siguiendo una geodésica temporaloide en el continuo tiempo-espacio curvado adyacente a la estrella, y un rayo de luz moviéndose en las proximidades del sol sigue una geodésica nula en ese mismo tiempo-espacio. ' 1=0 ' 1=0 ' 1=0 La solución de las ecuaciones locales del campo gravitatorio G' 1 =-r-t l ' k (i,1 = 0, 1, 2, 3), en una región tetra-dimensional del tiempo-espacio y que presenta interés desde el punto de vista físico, cuando se supone conocido el tensor de energíaimpulsión en el interior de esa región y se añaden condiciones en su frontera adecuadas, permite determinar las componentes del tensor métrico. A su vez a partir de estas componentes se calculan los coeficientes de conexión, las posibles líneas de universo de la radiación y de los cuerpos materiales en el interior de esa región, así como el tensor de curvatura de Riemann-Christoffel y otras propiedades de interés del continuo tiempo-espacio-materia. Las geodésicas, sea cual sea su tipo en el tiempo-espacio curvo, se determinan a partir de los coeficientes g i 1, generalmente variables de un punto a otro del espacio, a partir... d 2 x 1 (u) i dx 1 (u) dx k (u) de las ecuaciones presentadas en 9.5: + > r. k = 0 du jt du du 179

180 Investigaciones posteriores 147 sobre la ley de conservación ^4 t T 1 ' 1 = 0 (i = 0, 1, 2, 3) y l=0 su relación con las ecuaciones del campo gravitatorio G' k = -K T 1 ' k (i,1 = 0, 1, 2, 3) mostraron que la condición de anulación de la divergencia covariante del tensor de energía impulsión implica el movimiento geodésico de la radiación y los cuerpos materiales La relatividad restringida y la gravitación newtoniana como casos límite. Deducción de la conexión entre M y G. 148 Las componentes (siempre no dimensionales) del tensor métrico se pueden expresar así: Si k = m i k + &i k Aquí m i k son las componentes del tensor métrico para un tiempoespacio de Minkowski tetra-dimensional y & k es una perturbación asociada con la curvatura del continuo tiempo-espacio-materia. Ahora bien, hay esencialmente un espacio de Minkowski. La diferencia en los tensores m i k de un punto a otro del continuo tiempo-espaciomateria se debe solamente a las coordenadas utilizadas para describir la variedad. Pero en todos los casos un cambio de coordenadas en cada variedad de Minkowski tangente lleva el tensor métrico de esa variedad a la forma canónica m 0 0 = +1, mj 1 = m 2 2 = m 3 3 = -1 y m i k = 0 siempre que i ^ 1. Si las componentes del tensor de curvatura de Riemann-Christoffel se aproximan a cero en todos los puntos (eventos) de la variedad, las derivadas parciales de las perturbaciones & k se aproximan a cero en todos los puntos del tiempo-espacio-materia. Entonces la variedad riemanniana de la teoría generalizada se aproxima al tiempoespacio plano de la teoría restringida y debido a como se definieron las perturbaciones, éstan deben tender a cero. Y si las & k tienden a cero, las componentes del tensor de curvatura tienden a cero y la variedad límite es plana. Supongamos que, además de ser pequeñas respecto de 1 las magnitudes de las perturbaciones h i k, las velocidades del movimiento de los cuerpos materiales es en 147 W. Rindler "Relativity: special, general and cosmological', Oxford University Press, U.K M. Hobson, G. Efstathiou y A. Lasenby, "General relativity: an introduction for physicists", Cambridge University Press, Cambridge, U.K, C. Misner, K. Thorne y J. Wheeler "Gravitation" W. Freeman, San Francisco, Sobre el límite newtoniano puede consultarse, por ejemplo, los libros ya citados de A. Einstein "El significado de la relatividad', 2 a edición, Espasa Calpe Argentina, Buenos Aires, 1952; L. Landau y E. Lifchitz "Teoría del campo", Reverté, Barcelona, 1982; R. Lambourne, "Relativity, gravitation and cosmology", Cambridge University Press, U.K. 2010; W. Rindler "Relativity: special, general and cosmological", Oxford University Press, U.K. 2001; M. Hobson, G. Efstathiou y A. Lasenby, "General relativity: an introduction for physicists', Cambridge University Press, Cambridge, U.K. 2006; C. Misner, K. Thorne y J. Wheeler "Gravitation", W. Freeman, San Francisco, La partición del tensor métrico se efectúa de tal forma que las perturbaciones h k (x 0,x 1,x 2,x 3 ) no sean constantes en toda la variedad, a menos que se anulen en todas partes. 180

181 todas partes pequeña respecto de la velocidad de la luz y dichos cuerpos no interactúan en forma significativa mediante colisiones. Un sistema de cuerpos materiales lo bastante separados como para ser considerado en gran escala espacial como un fluido con presión nula en todas partes, forma lo que se conoce como polvo. En el caso de un polvo las componentes del tensor de energía-impulsión se reducen a la forma 2 k = p U i U k siendo p la densidad del polvo y U. las componentes del cuadrivector velocidad introducido en la parte 8.5: U 0 = y- c U 1 = y v 1 U 2 = y v 2 U 3 = y v 3 Como en este caso todas las componentes v. de la velocidad local del polvo son por hipótesis pequeñas respecto de c, resulta que y = 1 y que = p c 2 es dominante respecto de las demás componentes del tensor, 2 0 k (con k = 1, 2, 3 ) y con mayor razón T i k (con 1,k = 1, 2, 3 ), que se pueden despreciar. Entonces el escalar 2, que aparece en las ecuaciones del campo gravitatorio puestas en l af or mae i, = - K { - I. ^. r perita: 2, 7 = p c 2 Como consecuencia, estas 10 ecuaciones se reducen a 9 ecuaciones homogéneas E i k = 0 cuando al menos uno de los subíndices no es nulo, y una única ecuación no homogénea, donde la densidad de energía asociada al polvo aparece como fuente del campo: E,0 = -K (20,0-2 g0,0 2 j = -2 K p c 2 Es posible demostrar que, cuando las perturbaciones en el tensor métrico de la variedad & k respecto del tensor métrico del tiempo-espacio de Minkowski son débiles, entonces n ^ dr 1 0,0 1 i. d & 0 0,,,,. E 0 0 = -> y r 0,0 = > m' 1. Como consecuencia de estas dos últimas 0,0 dx 1 ' 2.= 0 dx ; 1=0 & relaciones se obtiene: E 0 0 = 3 d 1,; 2 &0,0 m,j 2 1^0 d(x 1 ) 2 Pero las coordenadas locales se pueden seleccionar de modo que m 0 0 = +1, mj j = m 2 2 = m 3 3 = -1y m 1 k = 0 siempre que 1 ^ k. Si, además, suponemos que las perturbaciones & k se mantienen aproximadamente constantes en el tiempo, resulta que las derivadas respecto de x 0 se pueden despreciar. De donde, empleando coordenadas cartesianas, finalmente resulta que: 1 d(x) 2 dm 2 d(z) 2 Como E 0 0 = - K p c 1 2 se obtiene para la componente & 0, 0 una ecuación de Poisson: d 2 &0, 0. d 2 &0,0. d 2 &0,0 _ K c2 d(x) 2 d(y) 2 d(z ) 2 = ^ Un polvo formado por cuerpos materiales con masa de reposo no nula origina líneas de 181

182 universo temporaloides caracterizadas por tener un elemento de intervalo positivo. En ese caso las ecuaciones de las líneas geodésicas que describen el movimiento de una partícula de polvo debido solamente a efectos gravitatorios se pueden poner en términos...., d 2 x 1 (s) ' dx 1 (s) dx k (s) del intervalo como parámetro: 2 + > r. k = 0 ds 2 jk ds ds En condiciones de campo gravitatorio débil y velocidades de movimiento pequeñas, el examen de estas ecuaciones teniendo en cuenta que el intervalo se puede aproximar por la expresión ds 2 = (dx 0 ) 2 - ^ (dx) 2 =c 2 dt 2 - dx 2 - dy 2 - dz 2, arroja las siguientes =1, d 0 d ' v 1 d 2 ' 1 d 2 ' relaciones: x ~ 1 x ~ -x x ~ -r 0,0 (i = 1, 2, 3) ds ds c ds 2 c 2 dt i 1 3 i h h 0 0 i i Como ahora r 1 0, 0 = > m',j = (i = 1, 2,3 con m'' =-1), entonces 2 dx J 2 dx' resulta la ecuación del movimiento d 2 i c 2 h x' dt 2 2 dx' 00 que es idéntica a la fórmula d 2 x' dp..., 2 newtoniana = si igualamos h n 0 n 0 = p siendo p el potencial dt 2 dx' 0,0 c 2 gravitatorio newtoniano. 2 h h h Sustituyendo este resultado en 2 + V + 2- = Kp^c se obtiene a ( x ) a ( y ) a ( z ) d 2 p d ( d ( = d(x ) 2 + d(y ) 2 +d(z ) 2 = 2 P K De la comparación con la ecuación del potencial gravitatorio newtoniano d P + d P + d P = 4n G^ p resulta la fórmula, introducida en , que d(x) 2 d(y) 2 d(z) 2 F 4 conecta la constante K de la ecuación tensorial para el campo gravitatorio con la constante de gravitación de Newton G y con la velocidad de la luz en el vacío: 8n G 2 Admitiendo esta última relación, y la identificación h 0 0 = p, se obtiene la teoría c2 newtoniana de la gravitación como caso límite de la teoría relativista para campos débiles y velocidades pequeñas: es decir, la ecuación newtoniana para el potencial del campo gravitatorio y las ecuaciones newtonianas del movimiento de los cuerpos en ese campo. En el límite newtoniano las componentes del campo gravitatorio son: = -c 2 r 1 0,0 (i = 1, 2, 3) En este caso particular los símbolos r 1 0,0 se pueden dx' considerar como representación de las componentes del campo gravitatorio. 2 En la aproximación que conduce a la gravitación newtoniana g 00 = 1 + h 0 0 = p, c2 182

183 mientras que g n = g 22 = g 33 =-1 y g 1k = 0 cuando 1 ^k. Entonces el elemento de intervalo se puede rescribir así: ds 2 = + ^ ) ^ c 2 di 2 -(dx 2 + dj 2 + dz 2 ) Este resultado se interpreta a veces diciendo que en la aproximación newtoniana, deducida en el marco de la teoría generalizada, el tiempo está curvado. En todo caso, para un elemento de intervalo como éste, en el que el potencial gravitatorio varía con las coordenadas espaciales, la correspondiente variedad tetradimensional de tiempo-espacio-materia no es plana. Siempre que los efectos gravitatorios no puedan ser despreciados, el tiempo-espacio estará curvado: así el tiempo-espacio-materia que constituye el caso límite consistente con la teoría newtoniana de la gravitación es una variedad curvada, no es plana, pese a que las velocidades de los cuerpos que forman los sistemas gravitantes son pequeñas respecto de la velocidad de la luz. Otra consecuencia notable de este caso límite es el efecto del campo gravitatorio sobre el tiempo propio que se considera en el próximo capítulo, en la parte Las relaciones epistemológicas entre las teorías de la física clásica luego de ser aceptada la teoría generalizada de la relatividad A partir de 1916 tenemos, en lo que puede denominarse teoría clásica (o sea, no cuántica) de campos y partículas, un panorama como el representado en el esquema siguiente: RELATIVIDAD GENERAL GRAVITACION NEWTONIANA RELATIVIDAD RESTRINGIDA FT" MECANICA NEWTONIANA DE PARTICULAS ELECTRODINAMICA CLÁSICA Como en los esquemas previos, las flechas de trazo continuo representan relaciones de dominio de una teoría sobre otra. La teoría generalizada domina sobre la gravitación newtoniana y sobre la teoría restringida. Las demás relaciones de dominio, compatibilidad e inconsistencia ya fueron explicadas. Como vimos en 10.3, si la curvatura del continuo tiempo-espacio-materia tiende a cero en todas partes, ese continuo se aproxima al tiempo-espacio de Minkowski de la relatividad restringida, el campo gravitatorio desaparece y la formulación matemática de 183

184 las leyes físicas no vinculadas con la gravitación se transforma en su formulación acorde con la relatividad restringida. Cuando la curvatura del continuo tiende a cero, la teoría generalizada tiene como caso límite a la teoría restringida. El movimiento relativista de cuerpos materiales en campos gravitatorios débiles y con velocidades pequeñas en comparación con la velocidad de la luz se aproxima al movimiento según la mecánica clásica en un potencial newtoniano: la teoría de la gravitación de Newton se obtiene como caso límite de la teoría de la gravitación de - Einstein. El tiempo-espacio-materia correspondiente a este caso límite está (débilmente) curvado, y solo se aplana si desaparecen por completo los efectos de la gravedad. Esto es una consecuencia de la implementación matemática de la idea del movimiento bajo los efectos de un campo gravitatorio considerado como movimiento libre en un espacio curvo, equiparando gravitación con curvatura. En consecuencia, al igual que en el caso de las relaciones epistemológicas entre la mecánica newtoniana y la mecánica relativista consideradas en 8.8, también en el caso de la teoría newtoniana de la gravitación y la teoría relativista de la gravitación no hay una traducibilidad estricta entre los lenguajes de ambas teorías. El entrelazamiento de los conceptos de tiempo y espacio ya presente en la teoría restringida, más la novedad de la curvatura, propia de la teoría generalizada y que permanece en el caso límite correspondiente a la gravitación newtoniana, muestran que consideradas en sentido estricto esas dos teorías son inconmensurables. No obstante hay suficientes homologías entre los términos propios de cada uno de los lenguajes como para poder realizar una comparación entre teorías sobre la base de sus balances predictivos y concluir que la nueva teoría relativista de la gravitación remplaza con propiedad a la antigua teoría. Puesto que según la teoría generalizada de la relatividad, un campo gravitatorio representa un cambio en las propiedades geométricas del continuo tiempo-espacio, cabe esperar que los intervalos de tiempo de los procesos y las distancias entre los cuerpos se vean afectados por el campo. Esto se confirma al analizar la relación entre el elemento de línea y los cambios en las coordenadas de tiempo y espacio cuando varían las componentes del tensor métrico asociadas con una variación del campo gravitatorio. Como cabe esperar que este último se modifique a su vez no solo de un lugar a otro sino de un instante a otro, los cuerpos materiales que componen un sistema mecánico en principio no permanecen a distancias fijas unos de otros: la deformación es inevitable. Los conceptos de equidistancia o de velocidad relativa fija entre dos cuerpos, en general carecen de sentido en presencia de un campo gravitatorio dinámico. Entonces los sistemas para la ubicación espacial de eventos, construidos mediante cuerpos cuyas distancias mutuas pueden ser tan grandes como se quiera y se mantienen invariables, que se postulan como parte de los marcos inerciales de la relatividad restringida, ya no son concebibles en la teoría generalizada. Para situar eventos en el tiempo-espacio en presencia de un campo gravitatorio se precisarían infinitos cuerpos con sus correspondientes relojes marchando con sus propios ritmos y llenando todo el continuo: solamente de esta forma se tendría un marco de referencia adecuado a la teoría generalizada de la relatividad. No obstante, en presencia de un campo gravitatorio, pero localmente en el tiempoespacio, los marcos de referencia de la relatividad restringida se pueden utilizar como una buena aproximación, incluyendo los relojes (que denominamos newtonianos en 2.1) y las varillas supuestamente rígidas, que se utilizan para determinar relaciones métricas 184

185 utilizando un modelo de espacio euclidiano 150. También en forma local se verifica con muy buena aproximación que el movimiento de una partícula libre de fuerzas respecto de uno de estos marcos es rectilíneo y uniforme en el espacio euclidiano correspondiente. Pero si se abandona la escala local y se mantiene la descripción en un espacio euclidiano, el movimiento no puede ya considerarse con buena aproximación ni rectilíneo ni uniforme, debido al efecto del campo gravitatorio El significado de la teoría matemática de la relatividad Para finalizar este capítulo sobre la formulación matemática de la teoría relativista de la gravitación, resumiremos algunas de sus aspectos de mayor importancia. El nuevo continuo tiempo-espacio introducido en la teoría generalizada, se puede representar localmente por un continuo de Minkowski, de forma análoga a como una superficie curva lo bastante regular contenida el espacio euclidiano tridimensional se puede aproximar en cada uno de sus puntos por el correspondiente plano tangente. La curvatura de este espacio en cada punto depende de la distribución de masas y sus movimientos, de tal forma que sus propiedades geométricas no pueden separarse de la materia ponderable y su movimiento. Pero además, el campo gravitatorio depende del campo electromagnético y en general de cualquier sistema físico: puede decirse que la gravitación emana de todas las entidades físicas 151. En principio, si se conocen y se agregan las ecuaciones de movimiento no gravitatorio de la materia y la radiación a la ecuación tensorial de la gravitación, esta última se acoplaría con las primeras a través de la versión generalizada del tensor de energíaimpulsión. Pero, a su vez las modificaciones en las propiedades métricas del tiempo-espacio provocadas por el movimiento de la materia ponderable y la radiación (a través del tensor generalizado de energía-impulsión que aparece en la ecuación tensorial del campo gravitatorio) actúan sobre ese movimiento: se puede concebir así el cierre de una cadena causal de tal forma que la dinámica de la materia-energía y la geometría del tiempo-espacio curvo se determinen recíprocamente. Se tiene en última instancia un mundo físico visto como una totalidad tiempo-espacio-energía o en forma equivalente, una totalidad de tiempo-espacio-materia. Al final se llamó la atención sobre el siguiente hecho: de las ecuaciones del campo gravitatorio, luego de varias transformaciones se pueden deducir las ecuaciones del movimiento de la materia y la radiación que produce el campo (las ecuaciones de las geodésicas en el tiempo-espacio-materia). Esto constituye una diferencia notable con la teoría electromagnética, en la cual las ecuaciones de la teoría implican la ley de conservación de la carga pero no las ecuaciones del movimiento de las cargas que producen el campo. Mientras que la ubicación y el estado de movimiento de las cargas eléctricas puede ser dado en forma independiente del campo electromagnético que esas cargas producen (por lo menos en principio), en el caso del campo gravitatorio la ubicación y el estado de movimiento de las fuentes del campo (partículas y radiación) El campo gravitatorio local se sustituye por un marco de referencia no inercial localmente equivalente, como se explicó en 10.1, y el marco no inercial es aproximado a su vez en el entorno de un instante de tiempo por un marco inercial. 151 Tanto las partículas como los campos electromagnéticos, incluyendo las ondas electromagnéticas, y los mismos campos gravitatorios y las ondas de gravitación producen campos gravitatorios. 185

186 no se pueden establecer en forma arbitraria: deben ser determinados al mismo tiempo que el campo. Como las ecuaciones de la gravitación solo determinan el movimiento debido a la gravedad, en general es necesario introducir algunas relaciones adicionales específicas para resolver el problema. Por ejemplo, si las componentes del tensor de energía-impulsión corresponden a un fluido ideal, se debe introducir una relación entre la presión y la densidad de energía de ese fluido, como se verá en el capítulo 12 a propósito de los modelos cosmológicos. Otra peculiaridad de la teoría generalizada de la relatividad es el rol del campo gravitatorio en las leyes de conservación. Como vimos en 9.5.2, las derivadas covariantes involucran los coeficientes de conexión Pk,l de la variedad. Para el tensor d 3 3 de energía-impulsión: 4 k 2 1,; = 2 1,; + r 1 k, i -2 l + Pk, i -2 1, 1 (i,j,k = 0, 1,2, 3) dx k, l=0 i,k=0 Como vimos en , los coeficientes de conexión se pueden considerar como las componentes del campo gravitatorio. Resulta entonces que en la expresión matemática 3 de la ley de conservación de la energía-cantidad de movimiento 4 l 2 1, l = 0 aparecen l =0 las componentes del campo gravitatorio. No puede formularse un principio de conservación para la materia aislada del campo gravitatorio. El campo gravitatorio transfiere energía y cantidad de movimiento lineal y angular a la materia, y a su vez 152 debe recibir de esta última energía y cantidad de movimiento lineal y angular. Las ecuaciones del campo gravitatorio no son lineales. Como consecuencia el principio de superposición, que es aplicable al campo electromagnético en el vacío, y que permite obtener nuevas soluciones sumando soluciones conocidas multiplicadas por coeficientes numéricos arbitrarios, ya no es aplicable en la teoría relativista de la gravitación. Esta no linealidad dificulta o imposibilita la construcción de soluciones analíticas para 153 resolver problemas concretos y conduce a la necesidad de emplear técnicas de simulación digital de las soluciones mediante ordenadores. Estas últimas, dada la naturaleza de las ecuaciones, no están exentas de dificultades, tanto en relación con los algoritmos numéricos utilizados como en relación con su implementación efectiva en el ordenador. Se han hallado varias dinámicas caóticas en la teoría relativista de la gravitación, con las consecuencias (mencionadas en la parte 3.4) sobre la imposibilidad de predicción, en la práctica, de los detalles cuantitativos de esas dinámicas. La formulación matemática de la teoría relativista de la gravitación es local y no global: determina las características locales del continuo tiempo-espacio-materia mediante un 153 A. Einstein " 7 sig«i/icado de la rela/ividad", Espasa Calpe Argentina, Buenos Aires, De todos modos, se han obtenido muchas soluciones analíticas tentativas sustituyendo campos tensoriales, que se consideraban como posibles candidatos a métrica para el continuo tiempo-espacio, en el primer miembro y analizando si el segundo miembro que se obtenía podía o no ser un tensor de energía-impulsión razonable. Los dos criterios más utilizados para clasificar soluciones son la clasificación algebraica de Petrov basada en un tensor introducido por Weyl y la clasificación según los grupos de transformaciones que conservan la estructura geométrica del espacio, basada en los denominados campos de Killing. Una explicación breve de estas dos modalidades de clasificación de los campos gravitatorios puede hallarse en D. Ivanenko y G. Sardanashvili "Gravitación", capítulo 1, Editorial URSS, Moscú

187 sistema de ecuaciones diferenciales en derivadas parciales que por sí solas no determinan la estructura en gran escala del espacio y el tiempo, es decir, sus propiedades globales. Como consecuencia las ecuaciones del campo gravitatorio poseen soluciones muy variadas, que corresponden a continuos tiempo-espacio-materia con propiedades globales muy diferentes. En la jerga cosmológica se hace referencia a soluciones con topologías diferentes. Por ejemplo, cuando las curvaturas locales son positivas, el continuo tiempo-espaciomateria puede resultar finito aún cuando sea ilimitado. Y no solamente finito en relación con las coordenadas espaciales, sino finito también en relación con la coordenada temporal. En este espacio curvado la asimetría entre el pasado y el futuro se verifica localmente, pero puede no verificarse globalmente, ya que una línea de universo que representa una trayectoria posible de una partícula, puede cerrarse sobre sí misma, como lo demostró Kurt Godel en un famoso artículo sobre las soluciones de las ecuaciones de campo en la teoría general de la relatividad. La única forma de excluir esta posibilidad es añadiendo a la teoría un principio ad-hoc que la elimine, como sugirió Einstein mismo, o bien modificar desde su base misma la teoría generalizada. 187

188 11. Solución de Schwarzschild y confirmaciones de la teoría de la gravitación "Cuando nos encontramos con un sistema de coordenadas que incluye una coordenada t y una coordenada r, resulta tentador asumir que tdebe representar el tiempo y rla distancia radial desde el origen. No obstante, una suposición como ésta es siempre peligrosa y a menudo es errónea. El hecho simple es que en relatividad generalizada las coordenadas son sistemas de marcas arbitrarias elegidas para distinguir un evento de otro. Esto nos otorga una gran libertad sobre cómo definir las coordenadas, una libertad que explotamos en la deducción de la métrica de Schwarzschild. La relación entre las diferencias de coordenadas que separan eventos y los correspondientes intervalos de tiempo o de distancia que serían medidos por un observador específico debe ser trabajada utilizando la métrica del tiempo-espacio. No se puede suponer que los tiempos y distancias "físicos" que se medirían utilizando relojes y varillas, se encuentran directamente especificados por las coordenadas. En relatividad general, las coordenadas no poseen ssgnificado métrico inmediato. Einstein consideraba que esta característica de la relatividad generalizada era un motivo de perplejidad. En su propio testimonio sobre cómo fue el desarrollo de la teoría a partir de 1908, decía: " Porqué se precisaron siete años para construir la teoría generalizada de la relatividad? La razón principal yace en que no es fácil liberarse de la idea de que las coordenadas deben tener un significado métrico inmediato". (Citado en P.Schlipp (Ed.) Albert Einstein-Philosopher Scientist, 3 a Edición, Open Court, Illinois, 1969). " R. Lambourne en "Relativity, gravitation and cosmology", p. 115, Cambridge University Press, Cambridge, U.K., La obtención de soluciones analíticas de las 10 ecuaciones en derivadas parciales no lineales y acopladas que describen el campo gravitatorio, con la condición adicional de que sean de interés desde el punto de vista físico para resolver un problema planteado de antemano, es como dijimos en 10.5 una tarea difícil, y a veces imposible, aún cuando se suponga conocido el tensor de energía impulsión. Por otra parte, una vez descubierta una candidata a solución, es preciso asegurarse que no sea una solución ya hallada expresada en otro sistema de coordenadas. En 1916, poco después de publicado el trabajo de Einstein en el que aparecían las ecuaciones del campo gravitatorio, Karl Schwarzschild, por ese entonces participando en la Primera Guerra Mundial y destinado al frente de batalla en calidad de oficial de artillería, se hizo de tiempo para hallar la primer solución exacta de esas ecuaciones, y unos meses más tarde falleció. Con el tiempo la solución de Schwarzschild resultó ser la más importante y fructífera de todas las soluciones analíticas conocidas para el campo gravitatorio. Ha servido como base matemática para calcular efectos que se han utilizado para confirmar la teoría de la gravitación de Einstein: la precesión del perihelio de Mercurio, la deflexión de la luz por el Sol, el corrimiento al rojo y la dilatación del tiempo debido al campo gravitatorio, y el retardo de los pulsos de radar en el sistema solar. 188

189 También se la utiliza para calcular algunos de los efectos asociados a las denominadas lentes gravitacionales y varias propiedades que se atribuyen a los agujeros negros. A partir de 1963, fue extendida en sucesivas etapas por otros investigadores, en buena medida interesados en la física de los agujeros negros. En este capítulo se estudian algunas propiedades y algunas aplicaciones de la solución de Schwarzschild. En el capítulo 13 se considera en forma somera su aplicación a los agujeros negros. Comenzaremos con un modelo que permite hallar, en forma directa y simple, las componentes del tensor métrico asociado a una masa puntual en el vacío. A partir de este resultado aproximado, mediante una nueva aproximación que compensa el error de cálculo de la primera, deduciremos la métrica de Schwarzschild El cálculo del tensor métrico mediante el modelo de Lenz. Métrica de Schwarzschild. Singularidades de coordenadas y singularidades gravitacionales. Es posible hallar las componentes g i k del tensor métrico en algunos casos particulares sin necesidad de resolver las ecuaciones de la gravitación, utilizando solamente una combinación de relatividad restringida con el principio de equivalencia entre la masa inercial y la masa gravitatoria, en forma análoga a la ya empleada en 10.1 con el fin de analizar el sincronismo de relojes, en reposo relativo, pero ubicados en puntos distintos de un campo gravitatorio que se supone se puede describir con un único potencial escalar, calculable en forma aproximada mediante la teoría newtoniana. Un modelo muy simple para hallar el tensor métrico utilizando estas hipótesis simplificadoras es el de W. Lenz comunicado por este autor al Profesor Sommerfeld en Lenz comenzaba por considerar un campo gravitatorio simétrico producido por una masa central M que se consideraba como una masa puntual, en reposo respecto de un marco de referencia K, sujeto al campo de gravitación Para describir los eventos respecto de este marco K usaba un sistema de coordenadas esféricas x 1 = r,x 2 = 0 x 3 = ( con centro en la masa puntual M, y el instante de tiempo x 0 = t determinado utilizando el correspondiente reloj sincronizado en K, de modo que cada evento se caracteriza por la cuaterna (x 0, x x, x 2, x 3 ) = (ct, r, 6, f) Luego Lenz considera una caja solidaria a un marco K x que cae libremente haciam. Como K x se encuentra en caída libre en el campo gravitatorio producido porm, no presenta campo gravitatorio alguno y transporta consigo una métrica de Minkowski g 00 = 1,g X1 =-1,g 22 =-1,g 33 =-1,g ik = 0 i ^k, válida también en el marco K cuando la distancia radial a la masa tiende a infinito y el campo gravitatorio se desvanece. La coordenada x~ se dirige radialmente hacia la masa puntual mientras que 154 A. Sommerfeld "Electrodynamics", Academic Press, New York, 1952, pp En el libro de J. Palacios "Eelatividad", Espasa Calpe, Madrid, se puede encontrar una crítica y una corrección a la presentación que hace Sommerfeld del modelo de Lenz. 189

190 las coordenadas y~ y z~ se disponen transversales a esa dirección. Por su parte t~ representa el instante determinado por el correspondiente reloj sincronizado en K x. Supongamos que v es la magnitud de la velocidad de caída de K x hacia M cuando la distancia radial entre la caja y la masa es r. Tanto r como v se toman respecto del marco K, sujeto al campo gravitatorio dem. Lenz asume que K x (que no presenta campo gravitatorio) se puede considerar instantáneamente como si fuera un marco de referencia inercial que se mueve con velocidad v respecto del marco K en reposo. En ese caso se aplican las transformaciones de Lorentz escritas de la siguiente forma infinitesimal 155 : v 2 dx ~ = - dt ~ = 1 ^ -dt dy ~= r-do dz = r-seno- dé i 1 - c 2 Ahora escribamos el intervalo respecto del marco K x, es decir: ds 2 = c 2 - dt" 2 - dx" 2 - dy " 2 - dz" 2 Respecto de K adopta la forma: ds 2 f 1 - : V c J dr 2 -c 2 -dt r 2 -do 2 -r 2 -sen 2 O-dé 2 f v 2 : V 1 O J Supongamos ahora que la caja que cae hacia la masa gravitante M posee una pequeña masa m cuando se halla en movimiento respecto de K x. Designemos con m 0 a su masa en reposo y supongamos que cuando la distancia entre las dos masas tiende a infinito, la velocidad de la caja respecto del marco K tiende a cero. En ese caso, respecto de K, la energía de la caja a distancia infinita de M es su energía de reposom 0 - c 2. Lenz supuso luego que se verifica la siguiente forma de la ecuación de la energía,, t \ 2 ^ m-m.. respecto del sistema K: (m - m 0 )- c - 5 = 0 r La energía cinética de la caja viene dada por (m -m 0 )- c 2 mientras que su energía potencial gravitatoria viene dada en una primera aproximación por la expresión m- M newtoniana - 5. La contracción del elemento radial y la dilatación del tiempo que emplea Lenz se desprenden de los resultados obtenidos en 6.1. El elemento (fot se encuentra en reposo en K x por lo cual su longitud dr respecto de K debe medirse simultáneamente en K: dr = - dx " El elemento dt~ se mide respecto a un reloj fijo a K x por lo cual es el tiempo propio de K x que se vincula con el elemento de tiempo dt medido en K mediante dt = dt ~ v 190

191 Como a distancia infinita de la masa gravitante M se verificam = m 0, si se asume que la energía potencial gravitatoria se anula en el infinito, se ve que la suma de la energía cinética y potencial gravitatoria de la caja se debe igualar a cero. m 0 Teniendo en cuenta quem = r, de la ecuación de la energía se desprende que i -? i v2 i a,, G- M,,.,,,,, 1 ^ = 1 donde a = 2 Si M es igual a la masa del sol, entonces a es de V c 2 r c aproximadamente 3 km. En consecuencia, como cabe esperar que para el caso del sol el modelo se aplique a distancias varios órdenes mayores que el radio solar (distancias del orden de la distancia de la Tierra al Sol) se puede efectuar la muy buena aproximación: í,,2 \ / 1 -ai» 1-2 a y -, partir de esa aproximación se obtiene para el intervalo: ds 2 = í 1 - c 2 -dt 2 dr 2 - r 2 - dd 2 - r 2 -sen 2 d-d^2 l r J r 2-a\ ^ Ésta es la famosa expresión deducida en forma exacta por Schwarzschild 156 a partir de construir una solución de las ecuaciones de la gravitación de Einstein R ik - g ik R = 0 para la región vacía del tiempo-espacio que rodea a un cuerpo 157 puntual de masa M, en reposo y sin rotación respecto de un marco K. Para esa métrica: 2 a 1., g00 = 1 11 = ^ 22 = -r <?33 =~r-sen d g K = 0 i ^ k r a 1 r Es una métrica estacionaria, puesto que las componentes del tensor métrico no dependen de la coordenada temporal. Además es estática: permanece invariante bajo la inversión del tiempo t -Í, puesto que los g i k no dependen del tiempo y en la métrica 158 no aparecen términos mixtos del tipo g t r - dt - dr g t d - dt - dd g t ^ - dt - d^. El tiempo-espacio correspondiente a esta métrica es asintóticamente plano: 156 Una deducción bastante detallada de la solución de Schwarzschild puede hallarse en R. Lambourne "Re/ativity, gravitation and cosmo/ogy", capítulo 5, Cambridge University Press, Cambridge, U.K., A nivel más avanzado se puede encontrar en el capítulo 25 de C. Misner, K. Thorne y J. Wheeler "Gravitation" W. Freeman, San Francisco, 1973, y en el párrafo 97 de L. Landau y E. Lifchitz, 'Teoria de/ campo", Reverté, Barcelona, O al menos con una masa distribuida con simetría esférica. 158 Estos términos mixtos aparecen en la métrica cuando la masa generadora del campo rota respecto del marco K. Si la rotación es uniforme, las componentes del tensor métrico no dependen del tiempo pero la métrica no es estática. 191

192 Cuandor ^ se ve que g 00 ^ 1,g n ^ -1 mientras que g 22 = -r,g 33 = -r-seno, y g i k = Opara i ^ k: al alejarnos de la masa gravitante recuperamos en K la métrica de Minkowski propia de un marco inercial: ds 2 = c 2 - dt 2 - dr 2 - r 2 - do 2 - r 2 - sen 2 O- df 2 Además ese tiempo-espacio posee simetría esférica en el siguiente sentido: Si fijamos un instante t = T y un valorr = R, el intervalo se reduce a ds 2 =-R 2 -do 2 - R 2 -sen 2 O- df. Pero en este caso particular - ds 2 describe la geometría sobre la superficie de una esfera bidimensional inmersa en un tiempo-espacio tetra-dimensional, de radio R y centrada en la masa generadora del campo. Desde el punto de vista físico y con esa métrica, todos los puntos del tiempo-espacio (c - T, R, O, é) correspondientes a esa esfera son equivalentes. 5- M El denominado radio de Schwarzschild r 5 = 2 - a = 2 establece un límite inferior 5 c 2 a las distancias radiales para las cuales se puede aplicar la fórmula para el intervalo en las coordenadas originales. Una vez alcanzado este límite se anula el coeficiente g 00 y se hace infinito el coeficiente g n del tensor métrico. No obstante no se trata de una singularidad físicamente significativa, o sea, gravitacional, sino de una singularidad en la coordenada. A diferencia de lo que ocurre en el caso de una singularidad gravitacional, las singularidades en las coordenadas se pueden hacer desaparecer mediante un cambio de coordenadas adecuado 159. La singularidad en r = 0 que presenta la métrica es una verdadera singularidad gravitacional, caracterizada porque al aproximarse a ella los invariantes que describen la curvatura del tiempo-espacio tienden a infinito. La singularidad no se puede eliminar mediante cambios de coordenadas 160. Como se verá en el capítulo 13, lo que ocurre al interior del radio r s corresponde a la física de los agujeros negros Gravitación y curvatura del continuo tiempo-espacio La fórmula del intervalo se puede escribir en términos del radio de Schwarzschild: ds 2 = f 1 - c 2 -dt 2 d r -, N - r 2 -d8 2 - r 2 -sen 1 - ^ r De la parte dependiente de las coordenadas espaciales 1 d r r 5 x r 2 O-df + r2 + r2 -sen2q_f se desprende que la traza en el continuo tiempo-espacio para un mismo instante de 159 Como el introducido por M. Kruskal en 1960, a partir de un análisis crítico de la asimetría en las así llamadas coordenadas avanzadas de Eddington- Finkelstein. Una explicación muy clara de estas coordenadas, en el contexto de un estudio sobre los agujeros negros, puede encontrarse en el capítulo 6 de R. Lambourne "Relativity, gravitation and cosmology", Cambridge University Press, Cambridge, U.K., C. Misner, K. Thorne y J. Wheeler "Gravitation" W. Freeman, San Francisco,

193 tiempo, es decir la parte del continuo que conocemos como el espacio físico, no es euclidiano. Para ver esto con más detalle, supongamos que hacemos d0 = 0. Entonces la parte espacial del intervalo es dr 1 - r» +r 2 -dd 2 Si calculamos la longitud de una línea equidistante de la masa central (circunferencia), es decir, para dr = 0, el elemento tangencial de línea se reduce a r-dd.de aquí resulta que la longitud de la circunferencia es 2 - n - r Ahora hacemos dd = 0y calculamos la distancia d 1 2 entre dos puntos de coordenadas '2 r y r2, con r s < r < r 2 : d u = J- \ dr r / Esta distancia es mayor que r 2 - r 1. En la geometría euclidiana el cociente entre la diferencia de longitudes de dos 2n(r - r ) circunferencias y la diferencia entre sus radios vale siempre ; 2 ^ = 2n, mientras (r2 - r1 ) que por efecto del campo gravitatorio vale 2n(r r ) (r r ) 2 < 2n. Como d 1 2 d 1 2 disminuye desde las proximidades de 1 cuando r 1 es muy grande respecto del radio de Schwarzschild hasta las proximidades de 0 cuando r 1 y r 2 se aproximan a ese radio crítico, el espacio físico, que es plano muy lejos de la masa gravitante, se curva cada vez más al aproximarnos a ella. G. Birkhoff, en 1923, demostró que todas las soluciones con simetría esférica de las ecuaciones del campo gravitatorio en el vacío (es decir, en la región exterior a las fuentes del campo) y cuya métrica tiende en el infinito hacia una métrica plana, son equivalentes (a menos de un cambio de coordenadas) a la solución de Schwarzschild 161. Este resultado se verifica aún cuando las fuentes del campo no se mantengan estacionarias, siempre que su efecto sea el mismo en todas direcciones. La solución de Scwarzschild, pese a que depende solamente de la masa total del cuerpo generador del campo, es de índole muy general. Una consecuencia de este resultado de Birkhoff es que si una distribución de masa con simetría esférica se expande, se contrae o pulsa en forma estrictamente radial, en la región exterior a cualquier esfera que contenga a la masa no se detectan modificaciones en el campo gravitatorio. Como los radios R de las estrellas son de un orden de magnitud mucho mayor que el radio crítico r s, se puede utilizar la solución de Schwarzschild en el espacio que rodea a una estrella, hasta la superficie de la misma. 161 G. Birkhoff'Re/ativity and modern _p&ysics", Harvard University Press, Cmbridge, Mass.,

194 En ese caso el cociente entre la longitud del ecuador y el radio de una estrella se puede estimar por la fórmula 162 : Sobre la superficie del sol el apartamiento de 2n es de solamente 0, Si ahora consideramos el flujo del tiempo en un mismo punto (dr = 0,dd = 0,d0 = 0) Entonces, si nos alejamos lo suficiente de la masa gravitante dt «dt, pero a medida que nos acercamos y el campo gravitatorio deja sentir sus efectos, dt se incrementa más respecto de dt : el campo gravitatorio produce una dilatación del tiempo. Finalmente, consideremos un rayo de luz que se desplaza en las inmediaciones de la masa que genera el campo gravitatorio. En ese caso el intervalo se anula siempre, debido a lo cual, respecto del marco K: Tomando dd = 0, d0 = 0, o sea, para una trayectoria radial de la luz se obtiene una velocidad de propagación expresada en términos de la coordenada radial r: Como la coordenada radial no representa una distancia (no posee un significado métrico inmediato), esta velocidad aparente no corresponde a la velocidad radial de la luz definida a través de la distancia recorrida por unidad de tiempo transcurrido. Tomando dr = 0, dp = 0, o sea, para una trayectoria en la que los fotones se mueven tangencialmente, se obtiene una velocidad de propagación distinta: Esta anisotropía en la propagación de la luz en un campo gravitatorio es solo aparente, debido a que la componente radial se calcula a partir de una coordenada que por sí misma no posee significado métrico. 162 Ver el capítulo 13 del libro de P. Bergmann "Introduction to t&e t&eory o/re/ativi/y", Prentice-Hall, New York,

195 Es posible efectuar un cambio de coordenadas tal que la velocidad de la luz sea la misma en todas direcciones (coordenadas isótropas). Las coordenadas isótropas se obtienen directamente de la expresión del elemento dr 2 espacial del intervalo: dl 2 = -p, r- + r 2 do 2 + r 2 sen 2 0 d< = d/ 2 r + dl 2 g + dl 2 2 i r i 1 ^ 1 Expresada a partir del intervalo, la velocidad radial es = 1 _^ -c. dt 1 _ r o s r. - J r dr dt Entonces, la velocidad radial de un corpúsculo luminoso resulta igual a las 0 velocidades tangenciales y -. Pero el efecto que siempre permanece es el dt dt enlentecimiento de la luz en las proximidades de las masas gravitantes. En un campo gravitatorio el postulado de la relatividad restringida, según el cual la velocidad de la luz en el vacío es constantemente igual a la constante universal c, ya no se cumple en general. No obstante, también en la teoría generalizada la velocidad de la luz es la misma, igual a c en cualquier sitio y en cualquier dirección respecto de un marco inercial local. Precisamente eso es lo que significan tanto la anulación del intervalo cuando se la interpreta desde un marco inercial de referencia como el límite común c de las velocidades radial y tangencial cuando la coordenada radial r de la métrica de Schwarzschild tiende a infinito Corrimiento al rojo en un campo gravitatorio Consideremos una masa central en cuyo campo gravitatorio se encuentra un observador a una distancia r de la masa. La métrica de Schwarzschild define una variedad de Riemann a través de las coordenadas x 0 = c-t x 1 = r x 2 =2 x 3 = < y el tensor métrico de componentes goo = 1 _ g = g22 =_ r &3 = _ r-seno g,i = 0 i * k r 1 _ r JL r Construimos el hiper-plano tangente (un espacio de Minkowski) por el punto de la variedad donde se encuentra el observador. Ese espacio tangente de Minkowski se encuentra libre de efectos gravitatorios: es plano. Sus coordenadas son X 0 = c-t X 1 X 3. El origen del espacio tangente coincide con el punto de tangencia en la X 2 variedad curvada. El elemento de línea en el punto es el mismo para la variedad plana tangente y para la variedad curvada: ds 2 =1 1 _ -c 2 dt 2 _ dr 1 _ ^ r _ r 2 -dd 2 _ r 2 sen O-d< = c 2 dt 2 _ dx 1 2 _ dx 2 2 _ dx 3 2 Para una partícula en reposo en el punto del campo gravitatorio considerado: 195

196 2 = 11 _ YL I. c 2. 2 = c 2. dz 2 Entonces las medidas del tiempo son diferentes en el marco inercial libre de gravitación (espacio de Minkowski tangente) dz y en el marco de referencia del campo gravitatorio di : dz = ^ 1 _. di La misma relación se aplica a los períodos de una oscilación medidos en un mismo punto, en un marco libre de gravedad y en el marco del campo gravitatorio. La relación correspondiente a sus magnitudes recíprocas, las frecuencias / 0 y f : f = y 1 _ -/ 0 Puesto que f es siempre menor que / 0, un campo gravitatorio produce siempre un corrimiento al rojo. Este es un efecto exclusivamente local. Pero ese efecto local para una oscilación de la misma frecuencia / 0 (respecto de un marco inercial), produce un corrimiento al rojo diferente en puntos situados a distancias diferentes de la masa que crea el campo. Si una fuente en reposo situada a una distancia r 1 de la masa gravitante emite un pulso luminoso de frecuencia / 1 medida en el marco de referencia del campo, un observador situado a una distancia r 2 en el mismo campo gravitatorio cuando mide la frecuencia de ese pulso encuentra que es / 2. Pero la fórmula f = 1 _. / 0 se aplica en ambos casos por lo cual: LL =. /1 r s 11 Como las longitudes de onda A son inversamente proporcionales a las frecuencias, X = 1 A 0 En consecuencia, entre la longitud de onda en el sitio donde se halla la r fuente de luz y la longitud de onda en el sitio donde se encuentra un receptor se verifica: X V r G-M _z. = J L Recordemos el radio de Schwarzschild: r, = 2 - X i r / A _A f_ f Si se define un corrimiento espectral C = = se obtiene:, A / C = 1 _ Yl 1 _ Yl 11.4 Movimiento de corpúsculos en un tiempo-espacio con la métrica de Schwarzschild: avance del perihelio de una órbita y defexión de la dirección de propagación de la luz. Consideremos ahora la ecuación de movimiento de un corpúsculo. Como vimos en , si se trata de una partícula, es decir, si posee masa de reposo no nula, se mueve 196

197 siguiendo una geodésica temporaloide, mientras que si su masa de reposo es nula se mueve siguiendo una geodésica nula. Cuando la masa de la partícula es lo bastante pequeña como para no perturbar la geometría del tiempo-espacio, es posible hallar una geodésica temporaloide que describe una órbita plana en torno a la única masa significativa, generadora del campo. Este caso puede utilizarse para describir el movimiento de un planeta en torno del Sol. La órbita de un planeta en torno al Sol que predice la mecánica newtoniana cuando se desprecia los efectos gravitatorios de los demás planetas y otros cuerpos materiales, es una elipse perfecta con el Sol en uno de los focos de la elipse. Esa elipse posee un tamaño y una forma especificados por el semieje mayor y la excentricidad (o en forma equivalente, por el semieje menor) y se encuentra fija en un plano denominado plano orbital. La orientación de la elipse en su plano puede determinarse por la dirección y sentido de la línea que une el sol con el planeta en el punto de la órbita en el que es mínima distancia entre ambos, conocido como perihelio. De acuerdo con el modelo newtoniano de órbita elíptica, esta dirección no debería cambiar. De acuerdo con el modelo relativista la órbita no es una elipse perfecta: el perihelio avanza con una velocidad determinada por la teoría. Como veremos, la geodésica nula puede deducirse a partir de la geodésica temporaloide efectuando un paso al límite, y permite predecir el ángulo en el que varía la dirección de un haz de luz cuando se aproxima desde el infinito a la masa generadora del campo, pero sin dirigirse directamente hacia ella, y después se aleja nuevamente al infinito. Comencemos por deducir una ecuación para la geodésica temporaloide. Lo podemos hacer directamente a partir del intervalo, sin necesidad de calcular los coeficientes de conexión (las componentes del campo gravitatorio como las denominaba Einstein), empleando para ello algunos resultados elementales pertenecientes al cálculo de variaciones Elementos de cálculo de variaciones Partimos de cuatro funciones regulares x 0 (u), x 1 (u), x 2 (u), x 3 (u) que definen un arco de curva en el tiempo-espacio. El parámetro recorre el intervalo[u A,u B ], siendo A y B los puntos extremos del arco en ese continuo tetra-dimensional. Por definición, para una curva temporaloide en el tiempo-espacio, el elemento de intervalo es definido positivo y se verifica: Resumiendo con x(u) el conjunto formadox 0 (u),x 1 (u),x 2 (u),x 3 (u), y con x(u) el conjunto formado por sus derivadas respecto del parámetro, introducimos la función La longitud de arco de curva entre los puntos A y B viene dada por: Una curva temporaloide que conecta dos puntos dados A y B, lo bastante próximos, es una geodésica si la longitud del arco correspondiente es mínima respecto de las 197

198 longitudes que tienen los arcos de otras curvas vecinas que pasan por los mismos puntos extremos. Entonces, hallar una geodésica temporaloide que une dos puntos A y B del continuo tetra-dimensional equivale a hallar una función x(w) que minimiza la integral que da la longitud de un arco de curva que conecta esos dos puntos. Con el propósito de simplificar la exposición, trabajaremos con una sola función x(w) y su derivada. Los resultados se extienden sin dificultad al caso de más de una función y más de una derivada. Partamos de una función x(w) y busquemos en qué condiciones hace que la integral tome un valor extremo en comparación con las funciones que toman los mismos valores que x(w) en los extremos del intervalo de integración. A esas funciones las denominaremos funciones admisibles. Si n(w) es una función lo bastante regular, tal que se anula en el valor inicial w A y final w B del intervalo de valores del parámetro sobre el cual se integra, y si es un número que puede hacerse arbitrariamente pequeño, llegado el caso, entonces x(w) + tf(u) es una función admisible, y todas ellas se pueden representar de esta forma. Definamos la función 0 ) = B [x +.r \ y desarrollémosla en torno a = 0 : 0 ( ) = 0 (0) + ^ (0) (0) fc 2 ) d 2 d El término o 2 ) es un infinitésimo respecto de 2. Para que 0 ) presente un mínimo cuando = 0, y para que ese mínimo corresponda a la función x(w), es necesario que se anule d0 í l para todas las funciones n d concebibles que se anulen en los extremos del intervalo sobre el cual se integra. dx dn Definiendo x = y n = un cálculo inmediato arroja que: dw dw d0(0) = [)[#- 3 (x(w), x(w ))n(w ) + 3 (x(w), x (w ))-n(w)]- dw J d «A dx dx Integrando por partes el término que presenta el factor f] y teniendo en cuenta que n se anula en los extremos del intervalo de integración, se obtiene: = f[f^- 3 (x(«), x(w))_ ^ 3 (x(«), x(w))] -n(w)]- dw J d "A l V dx dw dx ^ j Como esta integral se debe anular para toda función n(w), se puede aplicar el lema de b du-bois Reymond: si Jg(w).n(w).dw, siendo g(w) cualquier función continua en [a,b], a se anula para toda función n(w), entonces g(w) = 0 para todo w perteneciente al intervalo de integración. De este lema concluimos que la curva de longitud extrema x(w) verifica la ecuación diferencial conocida como ecuación de Euler: d 3 dx d3 = 0 dw dx 198

199 La solución de esta ecuación diferencial corresponde a un valor extremo de la integral. Para analizar si efectivamente se trata de un mínimo en general hay que estudiar los 1 d 2 términos siguientes del desarrollo, a partir de 20(o)^ 2, para todas las funciones admisibles. En el caso de la longitud de arco entre dos puntos lo bastante próximos la solución de la ecuación de Euler corresponde a un mínimo de la integral y por tanto determina la geodésica que buscamos. Finalmente, un último resultado que utilizaremos en el estudio del movimiento geodésico: para toda curva x(u) que verifica la ecuación de Euler con una función F(x, x), que no depende en forma explícita del parámetro u, se deduce que i x - F = 0 o sea que x - F = K es un invariante (es constante) sobre la du v dx J dx curva considerada. Consideremos ahora curvas x(u) en un espacio de n dimensiones y una función regular F(x(u), x(u)) que por lo demás es una función cualquiera, no necesariamente restringida a la función que permite calcular una longitud de arco sobre la curva. A cada función x(u) se le puede hacer corresponder un número real I[x] mediante la U) integral I[x]= J F(x(u), x(u)).du. La correspondencia x(ui[x] se denomina UA funcional. La longitud de un arco de curva es un ejemplo de funcional. Los resultados anteriores se pueden extender al problema de hallar un valor extremo de U) la integral I[x] = J F(x(u), x(u)).du, es decir un extremo de la funciona x(u) ^ UA Cuando F(x, x) depende de varias funciones coordenadas y de sus derivadas, df d df obtenemos una ecuación de Euler por cada coordenada x J, = 0 y un dx ; du dx 1 df invariante escalar V x 1 F = K sobre la curva. La suma se extiende sobre la t d x ; totalidad de las coordenadas de la curva considerada y K varía de una curva a otra adyacente. I[x]. En general la ecuación de Euler da una condición necesaria para hallar la curva que minimiza la integral, pero no una condición de por sí suficiente. No obstante, cuando se trata de la longitud de un arco de curva regular n-dimensional que une dos puntos lo bastante próximos, la condición es también suficiente Geodésica temporaloide Si tomamos el ángulo <p como parámetro, y expresamos la coordenada temporal y las otras dos coordenadas espaciales en función de este ángulo, entonces a partir de la 199

200 métrica de Schwarzschild obtenemos para la longitud de arco de la geodésica que une los puntos A y B: ( ds *a,b = J # f*< f, ( = J 3(i(^)' Kf),0(f), ] (f), Hf),0(f))df Por í ds definición: > 2,.N í r > í dt > 2 = 3 2 (t,r, 0, ],], 0) = Í1 _ H c r í dr Y 2 í 0 _ r _ r 2 -sew 2 0 De acuerdo con los resultados del cálculo de variaciones presentados en , las funciones t((f),r(<f),d(<f) que corresponden a una geodésica deben verificar las 33 d 33 ecuaciones de Euler. Para 0(f): r = 0 Calculando a partir de la fórmula 30 df30 para 3 2 í r ^ > r 2 - se«0- cos0 (t,r, 0, t, r, 0), la ecuación de Euler para 0 es: 3 3 Esta ecuación posee dos soluciones con 0(f) constante: 0(f) = 0 y 0(f) = n La primera restringe la trayectoria a un movimiento a lo largo del eje z. No se trata de una órbita sino de un movimiento radial (a lo largo del eje z) desde o hacia la masa generadora del campo, que se encuentra en el origen de las coordenadas espaciales. Pero la otra solución constante 0(f) = ^ corresponde a un movimiento que se produce en el plano x-y y por tanto permite describir una órbita. Supongamos entonces que 0(f) = n.,.. / a d3 d 33 ^, La ecuación de Euler para t(f), r = 0 es: dt df 3 ] d( c 2 -I 1 3 r = 0 dt Entonces la expresión entre paréntesis es una constante H y despejando t = resulta: df ] = - H-3 1 r En vez de hallar la ecuación de Euler parar, es conveniente trabajar con el invariante escalar, que sabemos por lo expuesto en que permanece ^ ^ constante sobre la trayectoria: t + r + 0 r_ 3 = > 3] 3 r 30 Esta última ecuación se puede re-escribir así, luego de multiplicar ambos miembros de 1 í la igualdad por la función 3 : - t r - 2 3t 3 r De la definición de 3 2 se desprende que: 1 í i + r 33 3 r < = > r 2 -sew

201 Como en este caso d(<f) = ~~es constante, resulta finalmente la siguiente relación: 1 (. df 2. df 2 1 i + r -F 2 = F 2 + r 2 -F 2 = r 2 = K F di dr Entonces: F^t(<),r(<\~~, t (<),oj = Puesto que F es positiva, la constante K también debe serlo. Para hallar una ecuación diferencial en términos de r y de <L solamente, se sustituye la d< dt í r 2 a 2 / ^ í A t \ 2, í, a fórmula obtenida para en F2 = 2 1 =11 -r.. C 2 m n d< v K J r J Vd<J í r 1 - s 1 V.í*I -r2 Después de varios cálculos, de introducir la nueva coordenada :(<) = e n r( < ) sustitución de la coordenada radial, luego de derivar respecto de < y de eliminar el factor común resultante, se obtiene la siguiente ecuación diferencial que describe d< d 2 : r 3 2 una órbita en el plano x-y: - + w = + r w Cuando la coordenada r(<) d< 2. K 2 2 crece lo suficiente, esta ecuación no lineal se puede aproximar por la ecuación lineal de un oscilador armónico de amplitud w(<) con d 2 w r / término forzante constante: - + w = - d< 2. K 2 Integrando esta ecuación se obtiene 1 r r (<) 2 K 2 5 cos(< - < 0 ) siendo C y < 0 constantes de integración que dependen de los valores iniciales de w(<) y d e ~W(<). En algún punto de la órbita de la partícula se debe presentar un valor mínimo de la coordenada r(<). Esta condición se puede satisfacer eligiendo < 0 = 0 de tal modo que w(o) = r (1 + e) sea máximo y por tanto w(o) = 0. Entonces la ecuación de la 2 K 2 d< K ' 1 r órbita se puede escribir así: w(<) = - -^ = (1 + e cos(<)) r (<) 2 K 2 1 r Definiendo = 2 2 y despejando r(<) resulta la bien conocida ecuación de una P cónica en coordenadas polares con centro en uno de los focos: r(<) = -,, 1 + e cos(<) Este es el mismo resultado que se obtiene en mecánica newtoniana para el movimiento de una partícula en el campo gravitatorio producido por una masa localizada en r =

202 El perihelio (la mínima distancia entre la masa generadora y un punto de la órbita) vale r = ^. min A 1 + e La excentricidad e de la órbita debe ser estrictamente positiva. Cuando e se encuentra comprendida entre 0 y 1% la órbita es una elipse y el movimiento de la partícula en la aproximación newtoniana es periódico. En este caso el afelio (la máxima distancia entre la masa generadora y un punto de la órbita) se alcanza para valores angulares desplazados en n radianes respecto de los ángulos en los que se alcanza el perihelio, y vale r = P w+x e Si la excentricidad vale 1 la órbita es una parábola, y si es mayor que 1 la órbita coincide con la rama de hipérbola adyacente al foco. Cuando el término no lineal debe ser tenido en cuenta, se puede construir una solución aproximada aplicando una variante del método de perturbaciones de Poincaré-Linstedt. Para ello se asume una solución tentativa de la forma 163 : :(f) = -^r = A + ) cos(z f) + C cos(2 Z f)+.. r (f) Al orden cero de aproximación, se tiene la misma órbita que en la mecánica newtoniana, pero al primer orden de aproximación resulta: :(f)= * (1 + e cos(z f)) Z«r(f) 2 > 2 V Z ^ 4 > 2 Cuando la órbita está acotada en su plano, la aproximación de orden cero es una elipse 1 + 1! r/ de 1 semie T- P P 2- p J e ma y or En este caso: a. 2 a = r w ín + r w+x = + = e 1 - e 1 - e 2 Puesto que de la definición de p se puede concluir que > 2 = - r^-, y p = a (1 -e 2 ) 2 P r 1 resulta > 2 = f 1 De esta última fórmula se desprende Z ~ 2 a (1 - e 2 b ) / L 1 + 3^ 2^ a - e 2 ) Al primer orden de aproximación las magnitudes del perihelio y el afelio de la órbita no se alteran, pero la dirección del perihelio rota lentamente debido al factor Z que aparece en el argumento del coseno. Para que Z'f sufra un incremento de 2n y por tanto la partícula se encuentre nuevamente en el perihelio si en él se encontraba antes del incremento, f debe haber sufrido un incremento de 2n + Sf tal que 2n = Z (2n + Sf). 1 ^ 3n r, 6 Entonces el perihelio avanza un ángulo Sf = 2n en cada.z" T att-e 2 ) revolución. La órbita, casi elíptica, no se cierra sobre sí misma: rota en torno al foco ( 163 Sobre este método, ver por ejemplo el libro de P. Kahn "Maí&ewaí/ca/ Meí&ods yór Sc/ení/ste and Eng/'neers: Z/'near and'on//'near Sysíews", Dover, N. Y., Su aplicación en la teoría relativista de la gravitación se puede encontrar en A. Sommerfeld "E/ecírodynaw/'cs", Academic Press, New York,

203 donde se encuentra la masa generadora del campo, formando en el plano x-y una figura conocida como roseta. Como r s = 2^ G~ M es constante, la magnitud angular 8 f> de este movimiento de c precesión puede aumentar solamente si se modifican las características geométricas de la órbita elíptica: si el semieje mayor de la órbita disminuye o si la excentricidad aumenta. Estas modificaciones acercan la partícula a la región donde el tiempo-espacio se encuentra más curvado, es decir, en las proximidades de la masa generadora del campo. Por este motivo, en el sistema solar el mejor candidato para contrastar la predicción de la teoría generalizada sobre la precesión del perihelio con los datos de observación es el planeta Mercurio Geodésica nula Para una geodésica nula, como es el caso de la trayectoria de un rayo de luz F 2 (i, r, 0, i,r, 0) = 0 Este caso se puede reducir al caso estudiado en si K se hace tender a + ^.Se obtiene entonces la ecuación no lineal: d - W + w = r 5 w 2 dé A partir de la solución obtenida mediante el método de perturbaciones mencionado en , haciendo tender K a infinito, Z tiende a 1 y es posible demostrar que la siguiente es una solución aproximada para la trayectoria de la luz en el plano x-y: w(é) = -^r = B 2 + ) cos(é)_ B 2 cos^i r (é) 4 4 Supongamos que la mínima distancia de la trayectoria a la masa generadora del campo es R y se alcanza para é = 0. Entonces w(o) = - = -^B 2 + B _ B 2 = B + B 2 R Si R es mucho mayor que r s = 2 G M 1-2, resulta que B = -R. Teniendo en cuenta la relación entre coordenadas cartesianas y coordenadas polares x = r cos(é), V = r sen(é) la trayectoria w = 1 = cos(é)_ ^ coste é) puede r 4 R 2 R 4 R 2 escribirse, luego de multiplicar por r R : R = ^ r 5 /_2,,.2, r s X 2 _ V X + V + X _ 2 4 R * ' 4 R y[x 2 +f En el plano x-y la trayectoria dada por esta función implícita se parece a una hipérbola. Presenta dos asíntotas, una corresponde a la dirección por la cual los fotones se aproximan a la masa desde el infinito y la otra corresponde a la dirección a lo largo de la cual se alejan al infinito. r Esas asíntotas vienen dadas por las fórmulas x = R ± v R Puesto que la magnitud de las pendientes es muy pequeña, se pueden igualar a los R ángulos que las asíntotas forman con el eje y. 203

204 El ángulo 2 r/ que forman las asíntotas da la deflexión de la trayectoria de la luz E debida al campo gravitatorio, respecto de su dirección original. Evidentemente, cuanto mayor sea r S = 2^ 5 ; y menor sea E, mayor será la deflexión. Por tanto, para c maximizar el efecto, el cuerpo generador del campo debe ser lo más masivo que sea posible y la luz debe incidir rasante a su superficie. Por este motivo las primeras confrontaciones de la predicción relativista de la deflexión de la luz con los datos de observación se efectuaron empleando la luz de una estrella incidiendo rasante en la superficie del Sol, durante un eclipse de este astro Confirmaciones de la teoría de la gravitación de Einstein Desde 1919 hasta 2003 se han efectuado un conjunto de observaciones y experimentos tendientes a contrastar algunas consecuencias cuantitativas de la teoría de la gravitación que se conviene en agrupar bajo la denominación de pruebas clásicas 164. Estas se clasifican en cuatro categorías: 1. La precesión del perihelio de mercurio. Como vimos en , según la mecánica newtoniana la dirección del perihelio de un planeta no debería cambiar. Pero ya en 1845 se había observado que con cada órbita sucesiva la dirección del perihelio de Mercurio en su plano orbital se modificaba ligeramente en un movimiento conocido desde entonces como precesión del perihelio. Parte de este movimiento se pudo explicar por los efectos gravitatorios de los demás planetas, pero permaneció una rotación residual de 43" de arco cada 100 años, sin explicación satisfactoria en el marco de la mecánica clásica. En 1915, a partir de una solución aproximada de las ecuaciones del campo, Einstein mostró que la nueva teoría de la gravitación permitía predecir el avance del perihelio. A menos de una incertidumbre del 1 %, la predicción basada en la teoría está de acuerdo con las mediciones. La teoría restringida conduce a una precesión del perihelio debido a la variación de la masa relativista con la velocidad de la partícula, pero predice la sexta parte del valor obtenido mediante la teoría generalizada. 2. La deflexión de la dirección de propagación de la luz de las estrellas por efecto del campo gravitatorio del Sol. Este efecto ya había sido estudiado en el marco de la mecánica clásica, desde el punto de vista de la teoría corpuscular de la luz introducida por Newton. La deflexión calculada resulta ser la mitad de la deflexión relativista. Cuando un rayo luminoso pasa rasante a la superficie del Sol, el acuerdo entre la teoría de la gravitación de Einstein y las mediciones para luz visible se produce a menos de un error del 10 %. El acuerdo en el caso de microondas provenientes de quásares (fuentes de ondas electromagnéticas extremadamente lejanas y potentes que se consideran en el próximo 164 Una descripción bastante detallada de las pruebas ya efectuadas, o previstas dentro de los próximos años, puede hallarse en el libro de R. Lambourne "Ee/aí/'v/Ty, grav/íaí/on and coswo/ogy", capítulo 7, Cambridge University Press, Cambridge, U.K., Se puede encontrar un resumen, a nivel más avanzado, al final del primer capítulo del libro de D. Ivanenko y G. Sardanashvili "Gravitación", Editorial URSS, Moscú

205 capítulo), detectadas mediante el procedimiento conocido como VLBI (very long baseline interferometry) que emplea dos o más antenas receptoras muy separadas (hasta miles de kilómetros), se produce a menos de un error del 0.04 %. 3. Corrimiento gravitacional hacia el rojo. En este caso hubo que esperar hasta el experimento terrestre de Pound y Rebka (1960) para trabajar con buena precisión. Este experimento consiste en mediciones de laboratorio efectuadas sobre un fotón gamma que es emitido por un núcleo de una muestra emisora ubicada en lo alto de una torre, cae verticalmente 22.5 m en el campo gravitatorio terrestre, y es absorbido en la base por un núcleo de una muestra receptora. La implementación del experimento se efectuó utilizando el efecto Mossbauer (para lograr una frecuencia de emisión bien definida) y vibraciones mecánicas (para inducir corrimientos por efecto Doppler capaces de cancelar el corrimiento por efecto gravitatorio). El acuerdo entre la predicción teórica y los resultados experimentales se produjo a menos de un error del 10 %. Experimentos más refinados realizados posteriormente por Pound y Snyder mejoraron el acuerdo entre teoría y experimentos a menos del 1 %. Poco después de formulada la teoría generalizada de la relatividad se comenzaron a obtener confirmaciones examinando el espectro de unas estrellas extraordinariamente densas, las enanas blancas. No obstante, la precisión de las pruebas efectuadas sobre una enana blanca descubierta en 1915, Sirio B, así como sobre otras enanas blancas, no se pudo incrementar en forma significativa hasta después de efectuado el experimento, en un laboratorio en la Tierra, por Pound y Rebka. El corrimiento gravitacional al rojo fue verificado en 1979 por el equipo de A. Vessot, utilizando un máser de hidrógeno enviado a bordo de un cohete Scout, midiendo la variación en la frecuencia a medida que se modificaba el potencial gravitatorio en una órbita a km de altura Este experimento verificó la dilatación del tiempo debida al campo gravitatorio de la Tierra a menos de un error de %, por lo cual se considera que constituye una de las comprobaciones más precisas de la teoría general de la relatividad. El funcionamiento continuado del sistema de posicionamiento global (GPS) también confirma la dilatación gravitatoria del tiempo a menos de un error diario del 1 %. 4. Retardo en los pulsos de radar debido al campo gravitatorio del Sol. Las pruebas se han efectuado de la forma propuesta por Shapiro en 1964 o en forma modificada. El último experimento, efectuado utilizando la sonda espacial Cassini en 2003, arrojó un acuerdo entre la predicción teórica basada en la teoría de Einstein y las mediciones a menos de un 0.002% de error. También se han efectuado experimentos basados en satélites y destinados a comparar las predicciones de la teoría con las mediciones realizadas en relación con la precesión de un giróscopo en dos circunstancias: cuando domina el efecto geodésico y cuando domina el efecto Lense-Thirring. Ambos son efectos extremadamente pequeños cuando se miden sobre una órbita en torno a la Tierra. El efecto geodésico consiste en la precesión del eje de rotación de un giróscopo que se encuentra en una órbita polar en torno a una masa gravitante que no necesariamente rota respecto de un marco inercial local. El movimiento del eje de rotación es un giro en 205

206 torno a la dirección radial, apuntando hacia el exterior de la masa, que adoptaría dicho eje en ausencia de este efecto. El efecto Lense-Thirring, también conocido como efecto de arrastre de los marcos inerciales por un cuerpo masivo en rotación, se refleja en un efecto de precesión distinto del geodésico. Aparece como otra precesión en el eje de rotación de un giróscopo en órbita polar en torno a una masa gravitante que se encuentra en rotación respecto de un marco inercial local. Los resultados obtenidos a partir de las mediciones efectuadas sobre los satélites LAGEOS I (puesto en órbita en 1976) y II (puesto en órbita en 1992) y formados por esferas de 0.6 m de diámetro y 411 kg, cubiertas con relectores para luz láser, no ponen en cuestión las predicciones de la teoría en relación con el efecto Lense-Thirring pero tampoco las confirman satisfactoriamente. En 2004 se puso en órbita en torno a la Tierra la sonda de gravedad B, que permite detectar y eventualmente medir el efecto geodésico y el efecto de arrastre de marcos inerciales. El acuerdo entre teoría y experimento en el caso del efecto geodésico se produce a menos de un 1.5 % de error, pero cuando el cuerpo masivo en rotación es la Tierra el efecto Lense-Thirring parece hallarse, por ahora, por debajo del nivel de ruido (o sea de las fluctuaciones aleatorias) asociado con las mediciones. Finalmente, ciertas observaciones astronómicas sobre lentes gravitacionales (que se consideran en la próxima parte 11.6) y sobre sistemas gravitantes que se supone incluyen agujeros negros (que se consideran en la parte 13.3) se toman como evidencia indirecta a favor de la teoría de la gravitación de Einstein Óptica gravitacional: lentes, espejismos y materia oscura A distancias lo bastante grandes de la masa gravitante, la métrica de Schwarzschild se puede aproximar así 165 : ds 2 = -^jj-c 2 -dí 2 - ( 1 + ^jj(dr dr) dr dr = dr 2 + r 2 - dd 2 + r 2 - sen dp 2 El término ± jj se puede reemplazar por { ^2 (r) donde representa un potencial escalar newtoniano. c 2 ' " Puesto que para la trayectoria de un fotón el intervalo se anula, de la métrica aproximada se deduce la siguiente expresión para la velocidad del fotón en un potencial gravitatorio débil: v = c-, + 2- $(r) 1 c2 c 1 ' $(r) c2 " c L. Landau y E. Lifchitz, 'Teoría de/ campo", Reverté, Barcelona, 1982,

207 A partir de esta fórmula se puede calcular el tiempo que le insume al fotón ir del punto A al punto B del espacio físico: T A^B = í A! La integración se hace respecto de un elemento de longitud dl de trayectoria espacial. Una aplicación del Principio de Fermat del tiempo extremo permite hallar la trayectoria seguida por el fotón en su viaje a través del campo gravitatorio. 166 Las variaciones en el potencial gravitatorio equivalen a modificaciones en el índice de refracción de un medio material: una verdadera óptica gravitacional se hace posible gracias a la teoría de la relatividad. Cuando una o más masas galácticas, o las masas ocultas asociadas a la denominada materia negra del universo, se interponen entre una fuente de radiación electromagnética del observador, se comportan como verdaderas lentes gravitatorias. La Figura 11.1 muestra un esquema de este efecto actuando sobre la radiación emitida por un quásar que llega a nuestro planeta en forma directa y también luego de haber sufrido una deflexión en el campo gravitatorio de una galaxia u otro cuerpo muy masivo. % QUASAR O IMAGEN REAL CUERPO QUE ACTUA COMO LENTE ESPEJISMO Figura Efecto de lente gravitatoria La primera observación de un espejismo gravitacional, es decir, de la creación de imágenes múltiples de una misma fuente por una masa interpuesta entre la fuente y el observador (en este caso situado en la Tierra) parece haber sido el "quásar doble" producido por la lente gravitacional formada por una galaxia y reportado en Utilizando métodos computacionales de procesamiento de imágenes, resulta posible suprimir las imágenes del quásar de modo de hacer aparecer una imagen de la galaxia que actúa como lente gravitacional. 166 Sobre el principio de Fermat y otros principios de extremo, incluidas aplicaciones a lentes gravitacionales, puede verse el libro de J.L. Basdevant "Variational principles in Physics", Springer Verlag, New York, Los quásares y los pulsares son fuentes de radiación electromagnética cósmica cuyas propiedades son bastante enigmáticas. Los quásares emiten energía a un ritmo miles de millones de veces mayor que el del sol, mientras que los pulsares emiten una radiación de muy alta frecuencia en forma de pulsos, con una periodicidad de un segundo o menos. Sobre estos y otros enigmáticos objetos cósmicos puede verse el libro de J. Rich "Fundamentals of Cosmology", Springer Verlag, Heildelberg,

208 Lo mismo se puede hacer en el caso de la Cruz de Einstein, que consiste en la imagen cuádruple de un pulsar (Q ) producida por una galaxia espiral, mostrado en la Figura Figura Cruz de Einstein Finalmente, la óptica gravitatoria se conecta con el tema de la materia oscura: una forma de materia que se propuso para explicar ciertos efectos dinámicos, como los relacionados con la velocidad de rotación de las estrellas en las galaxias, con los movimientos de las galaxias en los cúmulos galácticos y con los movimientos de los cúmulos en agregados de orden superior. La mecánica clásica se puede aplicar al estudio de la dinámica de los sistemas de cuerpos sometidos a interacciones gravitatorias, como las galaxias y cúmulos de galaxias. Los cuerpos componentes de estos sistemas, fundamentalmente estrellas y polvo cósmico, interactúan fuertemente entre sí mediante interacciones gravitatorias locales que se pueden describir mediante la teoría de Newton. Además interactúan con el resto de la materia del cosmos en forma más débil a través de la curvatura promedio del tiempo-espacio-materia en la región en la que esos sistemas se encuentran. Debido a que predomina la interacción gravitatoria dentro del sistema en la determinación de su dinámica, se los suele denominar sistemas auto-gravitantes. El teorema del virial 168 se puede aplicar a un sistema auto-gravitante que no se expande ni se contrae, es decir, tal que los cuerpos que lo componen no presentan una componente permanente de velocidad en dirección radial respecto del centro de masas, alejándose o acercándose del mismo. En ese caso, este teorema afirma que: 2 - E c + $ = 0 En esta ecuación E c es la suma de las energías cinéticas de los ' cuerpos que componen el sistema auto-gravitante y $ es su energía potencial de interacción gravitatoria. Si ; = m k es la suma de las masas m k de esos cuerpos, y i=1 / v 2 \ = -Y m, - v, 2 es el promedio del cuadrado de las velocidades, w ; 168 Ver por, ejemplo, L. Landauy E. Lifchitz "Mecán/'ca", capítulo 2, Reverté, Barcelona,

209 entonces 2- E c = M-(v Por otra parte, se puede estimar 5 - M, siendo R una dimensión característica del sistema (el radio si se trata de una estrella). Entonces, del teorema del virial se desprende la relación aproximada (v 2 ) ~ 5 M que R permite estimar una de las variables si se pueden determinar las otras dos. Cuando se aplica esta relación a los sistemas de estrellas lo bastante extensos, para los cuales se pueden estimar R, M y (ven forma independiente, se encuentra que (v^ es significativamente mayor que R M. Admitiendo que la estimación de R es correcta, entonces M debe haber sido subestimada. La masa faltante es lo que se conoce como materia oscura. En la práctica se procede partiendo de datos de observación para estimar el valor promedio del cuadrado de la velocidad relativa entre pares de galaxias. Este resultado junto con el teorema del virial de la mecánica clásica se utiliza entonces para estimar la profundidad del pozo de potencial gravitatorio promedio en la parte del Universo accesible a la observación. A su vez a partir de este último dato se puede estimar la densidad promedio del universo. Otros datos obtenidos a partir de observaciones permiten una estimación independiente de dicha densidad promedio, pero este último resultado da entre un 5 y un 10 % del valor obtenido partiendo de las velocidades relativas de las galaxias. La diferencia se supone corresponde a la materia oscura, mucho más numerosa que la materia ordinaria que compone las estrellas, los planetas, los cometas, los asteroides y el polvo intergaláctico. Se la denomina materia oscura fría debido a que las estimaciones de las velocidades de las partículas que la componen dan resultados mucho menores que la velocidad de la luz. Formando parte de la materia oscura galáctica, podrían existir bariones 169 (protones, neutrones e hiperones) ocultos en sentido de no emitir ni absorber radiación electromagnética en forma significativa. Esta materia oscura bariónica podría alterar las trayectorias de los fotones hasta producir efectos observables, como los halos galácticos y otros fenómenos, cuyo estudio se ha intensificado a partir del momento en que se dispuso de instrumentos astronómicos avanzados, como el telescopio Hubble. La evidencia observacional reciente sobre el corrimiento al rojo de la emisión electromagnética de la materia ordinaria de las galaxias (cuyos protones y neutrones representan apenas un 4% de la densidad de materia-energía cósmica) y su interpretación en el contexto del denominado modelo estándar lambda-materia oscura fría, sugiere que, además de la materia oscura fría (22 % del total de la densidad actual 169 La materia oscura bariónica formaría parte de objetos oscuros, como planetas grandes y agujeros negros. La cosmología astrofísica en su estado actual conduce a plantear la existencia de una materia oscura no bariónica. Sobre este y otros temas relacionados con la materia oscura y con la denominada energía oscura pueden consultarse los capítulos de la primera parte de la obra colectiva editada por G. Fraser "The new physics in the twenty first century", Cambridge University Press, U.K,

210 de materia-energía), existiría una forma de energía mayoritaria (74% del total de la densidad de materia-energía), conocida como energía oscura (Figura 11.3). Figura 11.3 Distribución porcentual de las fuentes del campo gravitatorio tal como se las concibe en el momento actual. El aporte de la materia ordinaria es apenas un 4% del total. Pero la materia oscura y la energía oscura nos conducen al próximo tema: el problema cosmológico. 210

211 12. El problema cosmológico "Es wna /wz mwy déé/7 /a gwe nos //ega de/ c/'e/o esíre//ado. =w" ser/a, s/'n eméargo, de/.pensam/'enío &wmano s/' nosoíros no ^wd/'éramos ver esías esíre//as, como &wé/'era swced/'do ^or eyemp/o, s/', a/ /gwa/ gwe sw &ermana Fenws, /a T/'erra se envo/v/'era s/'empre en wn manío de nwéest " Jean Perrin "Cwanío menos wno saée soére e/ Dn/'verso, más./ác/'/ es exp/'car/o. " León Brunschvicg "En 7975, /a íeor/a genera/ de /a re/aí/'v/'dad ^reíend/a &acer ^arí/'c/par a /a naíwra/eza, de /a //'éeríad gwe e/ espr/'íw &aé/a recon^w/'síado yreníe a/ es^ac/'o _y rec/amaéa a /a asíronom/a ^ara gwe dec/'d/'era, ^or med/'o de mwc&as ^rweéas, s/' /a geomeír/a.//s/'ca, s/' /a esírwcíwra de/ es^ac/'o-í/'empo era ewc//'d/'ana o no. 2res fenómenos ce/esíes esíaéan, a ^r/'or/', dados como cr/íer/os, en ^ocos años /a asíronom/a esíwvo en cond/'c/'ones de dar íres res^wesías./avoraé/es a wna geomeír/a no ewc//'d/'ana: /a de E/'emann... 4e esíe modo e/ es^ac/'o.perd/ó íodo carácíer aésíracío: se /'dení///ca con /os campos de grav/'íac/'ón.y í/'ene sws.prop/edades. Dn cwarío./enómeno asíronóm/'co....p/aníea /a cwesí/'ón de /a r/g/'dez de /os marcos de es^ac/'o-í/'empo; se íraía de /a ex^ans/'ón de/ Dn/'verso, soére e/ cwa/ /a oéservac/'ón.y /a íeor/a &an enredado sws resw/íados eníre 7925 y 79H0. Zo esenc/'a/ es e/ &ec&o s/gw/'eníe: un espacio-tiempo estático se considera imposible, e/ Dn/'verso íomado en sw con/wnío, no esíá en e^w/7/'ér/'o, e/ es^ac/'o-í/'empo awmenía sw rad/'o y /a./wga de /as ga/ax/'as re//e/a esía ráp/'da evo/wc/'ón. Más, a^w/, e/ pensam/'enío es íra/'c/'onado por /a /'nd/genc/'a de/ /engwa/e vw/gar. Or/g/'nadas en wn n/'ve/ /'n/er/'or, /as.pa/aéras son /'ncapaces de expresar /as re/ac/'ones donde, eníreíanío, se re/wg/'a /a rea//'dad de/ mwndo, /a verdad res/'de en /as yórmw/as donde se rompen /as esírec&as //gadwras de /o concreío, donde /a c/'enc/'a escapa a /a esírec&ez de /aspa/aéras... " Paul Couderc "Za Asíro/Zs/ca &a mod///cado íodas nwesíras /'/ws/'ones- en oíras.pa/aéras, &a camé/'ado nwesíra m/'sma a/ma." Anatole France En el leguaje común, se considera que la cosmología estudia el Universo (literalmente, todo lo que existe) tal y como es ahora, mientras que la cosmogonía nos informa sobre cómo se formó el Universo. Pero si se tiene en cuenta que las ondas electromagnéticas que captamos hoy, con telescopios ópticos o radiotelescopios, han viajado con una velocidad finita, se advierte de inmediato que nos ofrecen imágenes de las galaxias tal como se encontraban en el pasado, inclusive en un pasado muy remoto. 211

212 Estamos captando información correspondiente a un intervalo de tiempo de miles de millones de años de vida del Universo: cosmología y cosmogonía ya no se pueden disociar. La información procedente de nuestro grupo local de galaxias posiblemente corresponde, al menos a grandes rasgos, a su estado actual. La proveniente de otros cúmulos de galaxias corresponde al estado en el que se encontraban hace varios miles de millones de años, tiempo durante el cual estos sistemas pueden haber sufrido modificaciones profundas 170. En una galaxia como la nuestra, se sabe ahora que hay estrellas que nacen, estrellas que explotan, estrellas que pulsan. Partículas de polvo cósmico y gases deambulan entre las estrellas y en el espacio cósmico intergaláctico. Se forman y se disgregan grupos de estrellas, a veces asociados a la rotación de las galaxias, de tal forma que cuando las galaxias están lo bastante próximas, pueden mezclar su materia estelar. Las galaxias en traslación y rotación relativa se deforman y se dislocan, describiendo órbitas inmensas en los cúmulos a los que pertenecen. Los cúmulos de galaxias forman cúmulos mayores y estos otros mayores aún, mientras que la totalidad parece estarse expandiendo con velocidad relativa tanto mayor cuanto más grande sea la distancia que separa una parte de otra. Esta expansión del Universo ha constituido el problema principal de la Astronomía en el siglo XX. Su estudio teórico fue posible gracias a los modelos cosmológicos basados en la teoría generalizada de la relatividad. Como vimos en el capítulo 11, la teoría generalizada de la relatividad tuvo un notable éxito en la explicación de fenómenos locales que se presentan en el Sistema Solar o (a escala galáctica) en sus adyacencias: el retardo de los relojes en los campos gravitatorios, la curvatura de los rayos de luz por el campo gravitatorio debido a masas estelares, y el movimiento de precesión de las órbitas planetarias. También, sirviendo de base a una verdadera óptica gravitatoria, como se vió en 11.6, permite explicar el efecto de lente gravitacional provocado por las galaxias. Pero entre los fenómenos locales y la óptica gravitatoria por un lado, y por el otro el encare del problema cosmológico propiamente dicho, es decir, intentar responder a la interrogante acerca de cuál es la estructura espacio-temporal del Universo como un todo, su forma y su dinámica, hay una diferencia abismal. Para poner en perspectiva esto último, conviene comenzar por revisar algunos aspectos históricos de la relación entre la cosmología, la cosmogonía y las ciencias físicas (incluyendo entre estas últimas a la Astronomía) Aspectos históricos Los primeros sistemas cosmológicos surgieron estrechamente vinculados con las religiones. En general ubicaron a la Tierra en el centro del cosmos, como una extensión plana apoyada en columnas o flotando en el agua, sobre la que se ubican los cielos, y por debajo de la cual se halla un inframundo de naturaleza infernal. Los aspectos cosmogónicos se planteaban en términos de una creación divina. 170 La observación del cielo y la interpretación de los datos muestra que en las espiras de las galaxias se encuentran estrellas jóvenes, de edades del orden del millón de años, mientras que hacia el interior se hallan estrellas viejas, de edades del orden de los cinco mil millones de años. 212

213 Los pensadores griegos supusieron que cada planeta, la Luna y el Sol se movían alrededor de la tierra en su correspondiente esfera celeste, una cáscara traslúcida. Todas estas esferas estaban contenidas en la esfera de las estrellas fijas, más allá de la cual no había nada, con excepción del espíritu divino. El origen de la idea de las esferas astrales se encuentra en la presuposición de que los cuerpos celestes solamente podían moverse con movimiento perfecto, circular uniforme, y que aparte de los cambios de posición debidos a este movimiento, ninguna otra modificación es posible en los cielos. Cuando los fenómenos parecían contradecir las consecuencias de los principios, se buscaba una explicación para salvar los fenómenos. Si el Sol parecía presentar alguna variación en su aspecto visual, como una mancha en su superficie, se pensaba que ello era debido a una perturbación en la atmósfera que se interponía entre el astro y el observador. Si los movimientos aparentes de los planetas en la bóveda celeste parecían apartarse de un movimiento circular uniforme, ello se debía a que se combinaban varios de estos movimientos considerados perfectos. A medida que se fue perfeccionando la observación del movimiento de los planetas con el empleo de instrumentos más precisos, fue necesario ir aumentando el número de esferas hasta que a comienzos del siglo XVI se precisaron 80 esferas para dar cuenta de las observaciones. Así pues, durante 2000 años el modelo geocéntrico con sus esferas celestiales dominó el 171 pensamiento cosmológico, hasta la época de Copérnico, Galileo y Brahe y Kepler, cuando el centro del universo se trasladó de la Tierra al Sol, se registraron cambios en la supuestamente inmutable esfera de las estrellas y se comenzó a considerar como elipses a las órbitas de los planetas. Resulta interesante analizar la razón por la cual la Astronomía no se desprendió, antes de fines del siglo XVI o comienzos del XVII, de la cosmovisión geocéntrica, pese a lo absurdo de las medidas destinadas a "salvar los fenómenos" en este marco tradicional y la tensión generada entre el viejo paradigma y los resultados de las observaciones. 172 Como dice Dingle, si la Astronomía hubiera sido un campo independiente de estudio, esta complejidad podría haber estimulado esfuerzos para reformarla mucho antes del momento en que efectivamente se reformó: "pero otras esferas de estudio estaban tan entrelazadas con la Astronomía que era imposible reformar la Astronomía sin reformar también la Física, la Química, la Fisiología, la Psicología y la Teología (por utilizar términos modernos para materias de estudio que por aquel entonces no se encontraban tan claramente diferenciadas como lo están ahora). No se hubiera podido hacer sin alterar la totalidad del esquema de creencias. El Universo era, en aquel tiempo, un Universo en un sentido mucho más literal de lo que lo ha sido desde entonces. Un diagrama tomado de un texto antiguo lo evidencia: el Cielo, con Dios, poseía una localización que era una parte del universo físico tanto como lo eran la tierra y las esferas cósmicas. Cada uno de los planetas tenía su influencia particular sobre el temperamento humano: así se establecieron nuestros adjetivos mercurial, marcial, jovial, saturnino. Una calamidad humana era un desastre- contra las estrellas. Una 171 La idea de una Tierra esférica e incluso la idea de una Tierra que gira en torno al Sol aparecieron muy temprano en Grecia, pero fueron suplantadas por el sistema geocéntrico de Platón y Aristóteles. La codificación del sistema geocéntrico, en el siglo II, D.C., por Claudio Ptolomeo facilitó su integración en una concepción del mundo que abarca toda la Edad Media y el Renacimiento. 172 Herbert Dingle "Cosmology and science", en "The Universe Simon & Schuster, New Yok, 1957, pp

214 acción no natural era exorbitada, fuera de órbita. Los cuerpos terrestres se componían de cuatro elementos- tierra, agua, aire y fuego, cada uno de los cuales tendía a buscar "su propio lugar", y los cuerpos celestes estaban compuestos de un quinto elementouna "quintaesencia" - que no tenía paralelo en la mudable Tierra... Era claramente muy peligroso introducir una modificación en el interior de este esquema cuyas partes se encontraban tan íntimamente interrelacionadas, debido a los efectos imprevisibles sobre el todo." Con la aparición de la mecánica newtoniana comienza un período de tres siglos durante los cuales la Astronomía se libera de la Cosmología. La mecánica celeste se centra en la dinámica del Sistema Solar. Los astrónomos dejan a los filósofos los interrogantes sobre el origen del universo, sobre si posee límites, y sobre hacia dónde se encamina. No intentan abarcar el Universo como un todo. La Astronomía pre-relativista condujo a la creencia en un cosmos que ha existido siempre y que es infinito. En él se encuentran astros iguales o parecidos al Sol y los planetas, moviéndose de acuerdo con las mismas leyes, y posiblemente distribuidos casi uniformemente en el espacio. El espacio y el tiempo, independientes entre sí y absolutos, constituyen la forma de existencia de la materia y existen independientemente de ella. Estas ideas, enseñadas durante tres siglos, caducaron en unos pocos años, entre 1920 y 1930, debido a la aparición de la teoría generalizada de la relatividad y a una notable secuencia de descubrimientos astronómicos. A principios del siglo XIX, Wilhelm Olbers había planteado un problema que en el marco de un espacio infinito poblado de estrellas, con los conceptos de la mecánica newtoniana no tenía solución. Si las estrellas se distribuyen en forma uniforme a través del espacio, como parecía que lo hacían, entonces al mirar en cualquier dirección deberíamos encontrar una estrella más o menos cercana. Entonces el horizonte visual del cielo nocturno debería estar cubierto de luz presentando a lo sumo algunos puntos negros, los planetas, que absorberían una parte de esa luz. En lugar de eso, el fondo del cielo nocturno es negro. Otra dificultad, insalvable en un espacio infinito poblado de astros en todas partes, era una consecuencia de la ley de gravitación de Newton: el cálculo da que la fuerza de atracción sobre cualquier cuerpo material en estas condiciones debería ser infinita. La salida a estas paradojas en el marco de la Física clásica fue descartar las investigaciones que trataban del Universo como un todo: de esta forma se podía ignorar las contradicciones. La teoría de la relatividad hizo posible la construcción de modelos cosmológicos que superan esas contradicciones, empleando una nueva concepción de las relaciones entre tiempo, espacio y materia. Los problemas de la naturaleza, origen y destino del Universo volvieron a plantearse nuevamente, pero ahora en un marco científico y no en uno de filosofía especulativa El corrimiento del espectro de las galaxias y el horizonte de eventos El análisis del espectro de la luz que proviene de una estrella permite identificar las líneas de algunos elementos químicos que deben hallarse en la atmósfera estelar y que 214

215 también encontramos en la Tierra. Si la estrella se mueve radialmente respecto del observador, cabe esperar un corrimiento (efecto Doppler) de las líneas del elemento, respecto del espectro medido en reposo respecto del observador (en el laboratorio), hacia el rojo o hacia el azul según que la velocidad radial sea de alejamiento o de acercamiento al observador. Recíprocamente, si observamos un corrimiento hacia el rojo de los espectros de la luz proveniente de una estrella de nuestra galarxia o de otra galaxia, podemos inferir que la estrella o la galaxia se alejan de nosotros. Esto es precisamente lo que encontraron 173 Humason y Hubble para la casi totalidad de las galaxias. Lo informaron en una publicación en 1929, en la cual calcularon la velocidad de recesión a partir de la fórmula clásica, no relativista, para el efecto Doppler. Admitieron que la frecuencia emitida por la galaxia se relaciona con la frecuencia recibida en la Tierra a través de la fórmula = ( r V 1 - I donde V r es la c í velocidad de recesión. Entonces, teniendo en cuenta que la longitud de onda Áes inversamente proporcional a la frecuencia: V r = c = c Á l í l Á í _,, r A Á V r _,.. AÁ Reordenado: I I = = El corrimiento relativo al rojo C = es tanto l Á í Á c Á mayor cuanto más alejada se encuentre la galaxia. Según la fórmula clásica, la velocidad radial es proporcional al corrimiento. De la relación entre el corrimiento C y las estimaciones de diatancia se desprende que las galaxias se alejan de nosotros con una velocidad radial V r (generalmente dada en km/s) que parece ser proporcional a la distancia r (dada en años luz) que nos separa de esa galaxia: V r = H r La constante H se denomina constante de Hubble y H. posee dimensiones de 174 tiempo. Un observador situado en otra galaxia observaría el mismo fenómeno y enunciaría la ley de Hubble-Humason con la misma fórmula. Generalizando esta ley se puede decir que las galaxias se alejan unas de otras a una velocidad proporcional a la distancia que las separa: al parecer el Universo se expande. 1 r La ley de Hubble-Humason se puede re-escribir así: = H V r El miembro de la derecha en esta expresión se podría interpretar como el tiempo que le insume a una galaxia, desplazándose con velocidad uniforme V r, para recorrer la distancia r. Como el miembro de la izquierda es el mismo para todas las galaxias, 173 Solamente dentro del cúmulo de galaxias al que pertenece la Vía Láctea hay algunas galaxias que se aproximan a ella, como la nebulosa de Andrómeda. La totalidad de las galaxias pertenecientes a otros cúmulos se alejan. 174 Las dimensiones de H son (km/s)/años luz. El año luz es una distancia (la recorrida por la luz moviéndose en el vacío durante un año). 215

216 podría pensarse que todas las galaxias coincidieron en nuestra posición actual (o nosotros hubiéramos coincidido con ellas en un mismo punto): el Universo habría pasado por un estado donde toda la masa de las galaxias podría haber estado encerrada en la cabeza de un alfiler, por decirlo de alguna manera. Una especie de singularidad hiper-densa que luego se expandió explosivamente en una bola de fuego, con la radiación dominando la dinámica y la materia en forma de partículas relegada a un rol secundario, parece algo fantástico, pero como se verá es compatible con la teoría generalizada de la relatividad. Desde que fue estimado por vez primera, el valor numérico de la constante de Hubble ha sufrido varias modificaciones, siempre a la baja, a medida que se obtuvieron datos de objetos más lejanos y se pudo estimar las distancias de forma más precisa. Actualmente se estima en un valor cercano a los millones de años: esa sería H 175 una estimación grosera de la edad del Universo. Si las galaxias se alejan unas de otras a una velocidad proporcional a su distancia, llega un momento en que su velocidad de recesión alcanza la velocidad de la luz. Al final de 6.1 se hizo una distinción importante en relación con la adición relativista de velocidades. Por un lado se tiene el caso en el que un cuerpo se mueve respecto de un marco inercial K, el cual a su vez se mueve respecto de otro marco inercial K', y se busca la velocidad del cuerpo respecto de K': se aplica la ley de adición de velocidades relativista, de modo que la velocidad resultante no puede superar la velocidad de la luz. Por otro lado se tiene el caso en el cual dos cuerpos A y B se mueven respecto del mismo marco inercial K, y se busca la velocidad relativa del cuerpo A respecto del cuerpo B: ahora se calcula según la fórmula de adición de velocidades clásica, porque todas las operaciones se realizan respecto del mismo marco de referencia. Como consecuencia, si bien la velocidad c es un límite superior para todas las velocidades que pueden ser alcanzadas por los cuerpos materiales respecto de un marco de referencia inercial, la velocidad relativa de un cuerpo respecto de otro en el mismo marco de referencia puede resultar mayor que c. Entonces dos cuerpos en movimiento respecto de un mismo sistema inercial en principio pueden presentar una velocidad de recesión mayor que c. Pero de esto no se desprende que exista un cuerpo que pueda moverse respecto de K con esa velocidad mayor que c: no solamente en este caso no lo hay, sino que según la teoría de la relatividad no puede haberlo. Entonces la velocidad relativa de dos cuerpos, determinada respecto del mismo marco de referencia inercial, no puede superar el doble de la velocidad de la luz. El descubrimiento de los quásares (objetos casi-estelares al parecer mucho menores que una galaxia pero que radian la menos cien veces más energía que una galaxia grande y se encuentran en los confines del universo observable) en 1963, abrió un camino de investigación que condujo a una revisión de la ley de Hubble-Humason. 175 De acuerdo con la estimación más precisa disponible, basada en mediciones sobre la radiación de microondas cósmicas de fondo, esa edad sería de ± 0.12 billones (10 9 ) de años. Estimaciones menos precisas arrojan edades comprendidas entre los 11 y los 20 billones de años. 216

217 Resulta que Mc Vittie 176 y posteriormente otros investigadores de quásares hallaron corrimientos relativos C = AÁ bastante mayores que 3. Si el corrimiento es mayor que Á tres, la velocidad de recesión calculada mediante la fórmula clásica debe ser mayor que tres veces la velocidad de la luz lo cual, según la teoría restringida no puede observarse respecto de un mismo marco inercial. Pero cuando la velocidad de una fuente de luz se acerca a c es necesario utilizar la fórmula relativista deducida en para conectar la frecuencia emitida en un marco inercial K' con la recibida por el observador fijo a otro marco inercial K: ^ - 7 )... AÁ 1+ 7 c = ^ A partir de esta expresión resulta: C = 1 y 2-1 Á y- 1 - P- 1 - ^ Entonces, admitiendo que es posible aplicar la teoría restringida de la relatividad, la ley de Hubble-Humason debería reformularse así: V y r 1 + c -1 = Hr 2 1 y r - yr En ese caso por grande que sea el corrimiento relativo, resulta siempre una velocidad radial inferior a c. El problema es que en presencia de campo gravitatorio los marcos inerciales presentan un carácter local, mientras que los marcos inerciales de la relatividad restringida poseen un carácter global: cada uno abarca la totalidad del continuo tiempo-espacio. Según la teoría generalizada, un tiempo espacio de Minkowski diferente debe emplearse en diferentes regiones: la variedad tetra-dimensional plana, tangente en cada punto de la variedad riemanniana formada por el tiempo-espacio-materia, ya no es la misma al pasar de un punto a otro. Entonces un razonamiento basado en la teoría restringida de la relatividad queda invalidado porque en principio no es posible utilizar el mismo marco inercial para todo el Universo. Si la velocidad de recesión se interpreta como una propiedad general del tiempoespacio-materia es posible que la velocidad de recesión supere a la velocidad de la luz 177 dentro de ciertos límites, sin violar la teoría generalizada de la relatividad. A escala cósmica tiempo y espacio pierden su sentido físico simple. Cuando Mc Vittie estimaba la velocidad de recesión del quásar a partir de una estimación de su distancia a la Tierra, la noción de distancia debería precisarse más. Es la distancia entre el quásar y la Tierra cuando se emitió la luz o la distancia a la que se encuentra en el momento en 176 G. Mc Vittie "Distance and large redshifts", The Quaterly Journal of the Royal Astronomical Society, 15(3) 177 Esto es una consecuencia del denominado modelo cosmológico estándar. Esta consecuencia se estudiará en la sección

218 el que el astrónomo efectúa la medición del corrimiento al rojo? Continúa existiendo el quásar cuando el astrónomo lo percibe? 178 Como dice Paul Couderc : "La velocidad calculada posee un significado complejo y analítico: no es ni la velocidad de la galaxia cuando parte el rayo luminoso, ni su velocidad en el instante de la percepción por el astrónomo. Además, en el espacio que se dilata llega un momento en que dos galaxias ya no pueden percibirse, pues el intervalo que las separa crece más deprisa que la velocidad de la luz." Hay una separación a partir de la cual no llega información desde un objeto cósmico al otro: se ha alcanzado un horizonte de eventos, el horizonte cosmológico. Más allá el Universo nos resulta inaccesible, con independencia de las mejoras que podamos introducir en nuestros instrumentos y procedimientos de medición. En todo caso, se advierte que las categorías del conocimiento humano, adecuadas para actuar en las escalas intermedias de tiempo y espacio de la experiencia cotidiana, e interpretables desde la perspectiva de la teoría de la evolución biológica como rasgos adaptativos, resultan inadecuadas para pensar el cosmos. Parecería que el único lenguaje utilizable es el lenguaje matemático. El único camino para interpretar y guiar las mediciones y comprender el Universo desde una perspectiva científica es construir modelos matemáticos del cosmos: tarea formidable pero al parecer ineludible Modelos de Universo A medida que nos aproximamos a una masa la métrica del tiempo-espacio se modifica, poco o mucho según la magnitud de la masa y su concentración (densidad). Entonces, en las proximidades de una estrella la curvatura del tiempo-espacio varía. Esto se desprende de las ecuaciones del campo gravitatorio de Einstein: es un efecto local confirmado experimentalmente por observaciones astronómicas cuidadosas. Una vez admitido que el continuo tiempo-espacio no es euclidiano, parecería que el problema de la forma del Universo considerado como un todo se podría plantear en forma parecida a como en la antigüedad se planteó el problema de la forma de la Tierra. 179 Dejando de lado argumentos de filosofía especulativa y concentrando la atención en las observaciones y mediciones, se disponía de dos clases de evidencia sobre la forma de la Tierra. Un ejemplo de evidencia del primer tipo es la aparición gradual de los barcos que se dirigen a tierra (comenzando por el extremo del mástil más alto). Este tipo de evidencia es local y débil, porque la curvatura de una parte comparativamente pequeña de la Tierra, por sí sola no asegura que la Tierra esté globalmente curvada y tenga una forma aproximadamente esférica. Un ejemplo de evidencia del segundo tipo es forma circular de la sombra de la Tierra sobre la Luna durante los eclipses de Luna, en forma independiente del sitio en la Tierra desde el cual se observa el eclipse. Este tipo de evidencia es global y suministra un argumento empírico muy poderoso para afirmar la esfericidad de la Tierra, cuya primera 178 P. Couderc "Z'Dn/vers" Colección Que sais-je? N 687, Presses Universitaires de France, París, Como el argumento debido a Aristóteles: el movimiento natural de la materia pesada es dirigirse al centro del Universo, de modo que dicha materia se acumula allí dando origen, por razones de simetría, a una Tierra esférica. 218

219 confirmación preliminar se obtuvo luego de los numerosos viajes de circunnavegación, pero cuya confirmación definitiva se obtuvo gracias a los avances en astronáutica, a través de observaciones y mediciones en satélites artificiales y cápsulas espaciales. Pero en cosmología toda la evidencia sobre la curvatura del Universo es local, corresponde a la evidencia débil, del primer tipo, sobre la esfericidad de la Tierra. No se dispone de evidencia análoga a la evidencia de segundo tipo sobre la curvatura de la Tierra. La razón de esta carencia es que esta última evidencia se apoya en una tercera dimensión espacial, adicional a las dos dimensiones que caracterizan los puntos en la superficie de nuestro planeta, dimensión extra que en cosmología no existe. Como nos encontramos confinados a una pequeña región del cosmos, para definir su topología global no podemos recurrir a otras evidencias que las locales, lo cual desde el inicio conduce a que el trabajo en torno al problema cosmológico sea de índole muy especulativa. 180 Admitido esto, podemos preguntarnos con Paul Couderc : "La materia que cubre el Universo, es en conjunto incapaz de lograr, en gran escala, lo que cada grumo de realiza a su alrededor, en su escala? Qué razones tenemos para postular a priori un Universo euclidiano e infinito, cuando comprobamos que alrededor de cada estrella, al menos, es no euclidiano? Sin duda, el Universo tiene una estructura general menos simple que el marco euclidiano necesariamente infinito que la ciencia la atribuía sin escrúpulos, cuando no existían las geometrías no euclidianas. Una vez surgida la duda, era necesario plantear el problema, considerar teóricamente todas las soluciones posibles y tratar luego de ver, mediante observaciones, a cuál de estas soluciones se adecúa el Universo (a condición de considerar más adelante las posibles complicaciones del problema, del mismo modo que se pasó de una Tierra esférica a un geoide muy complejo)." La construcción de modelos cosmológicos se basa en tres suposiciones básicas que conviene explicitar. En primer lugar, se supone que el Universo es un cosmos: posee estructura y dinámica a gran escala, sujetas a leyes. En segundo lugar se supone que esa estructura y esa dinámica se pueden comprender a partir de las leyes físicas tal como las conocemos: se admite que esas leyes son universales pese a que solo las hemos podido confirmar en nuestros laboratorios y en el Sistema Solar 181. Finalmente, se supone que la parte relativamente pequeña que hemos estudiado dentro de la parte del Universo que podemos observar, es una muestra representativa del 182 conjunto. 180 P. Couderc "El Universo", Eudeba, Buenos Aires, 1961, p Los progresos de la astronáutica, la instrumentación y las comunicaciones han posibilitado verificar a distancias astronómicas la estabilidad de los valores de varias constantes físicas fundamentales obtenidas en laboratorios de nuestro planeta. Ver, por ejemplo, E. Norman: "Are fundamental constants really constant?" American Journal of Physics, 54, 1986, pp Este último punto es particularmente delicado, debido a que cuando, por mecanismos de interacción se forman super-sistemas a partir de sistemas materiales, aparecen propiedades que restringen la dinámica que los sistemas poseen cuando no interactúan. Los astrónomos que estudian la estructura han encontrado 219

220 Más concretamente, abordaremos el problema cosmológico desde la perspectiva física a partir de tres suposiciones básicas que, como se verá, se interrelacionan: (1) El principio cosmológico en su versión débil. (2) La aplicabilidad de las ecuaciones de Einstein para el campo gravitatorio al Universo en su totalidad. (3) El postulado de Weyl El principio cosmológico. El Universo material conocido es un conjunto de estrellas y planetas, formando galaxias y cúmulos de galaxias, nubes cósmicas, gases y polvos interestelares y radiación. Si bien a una escala relativamente pequeña la distribución presenta irregularidades, se puede suponer como una primera aproximación que en gran escala esas irregularidades se desvanecen. Con el término gran escala se hace referencia a dimensiones del orden de los 300c 10 6 años-luz o más (1 año-luz=9.461*10 15 m=0.307 parsecs) que se piensa caracterizan una gigantesca red de vacíos gigantes (estimados en un 90 % del volumen total) y super- 183 cúmulos de galaxias (estimados en un 10 % del volumen total). Para escalas cuyo orden de magnitud se encuentra por debajo de los100*10 6 años-luz el Universo muestra heterogeneidades y anisotropías, a medida que descendemos de los cúmulos de cúmulos de galaxias a los cúmulos de galaxias, a las galaxias por separado y aún más abajo. Postulamos entonces que en gran escala el tiempo-espacio-materia se comporta como si estuviera formado por un fluido continuo, homogéneo e isótropo cuya densidad correspondería al valor que se obtendría distribuyendo uniformemente toda la energía de la radiación y las masas, incluyendo la proveniente de la materia oscura y la energía oscura. 184 A esta suposición le podemos llamar principio cosmológico débil. Según el principio cosmológico débil el Universo presenta el mismo aspecto para todos los observadores situados en diferentes puntos del espacio. El principio cosmológico fuerte, planteado por Bondi, Gold y Hoyle, agrega la suposición de que el Universo presenta el mismo aspecto para todos los observadores en cualquier sitio y en cualquier instante de tiempo pasado, presente o futuro. evidencia sobre una estructura jerárquica hasta una escala de 10 9 años-luz lo cual es ciertamente una distancia pequeña en relación con el denominado horizonte cosmológico que se mencionó en Durante los últimos cincuenta años se ha venido acumulando evidencia experimental sobre la mencionada estructura de super-cúmulos de galaxias separados por vacíos gigantes. La evidencia más significativa al respecto se ha obtenido de un inventario detallado de quásares y del estudio del fondo de radiación cósmica fósil de micro-ondas. Sobre la evidencia observacional en la cual se sustenta el principio cosmológico así como el denominado modelo cosmológico estándar, puede consultarse el libro de S. Serjeant "Oiservaí/ona/ cosmo/ogy", Cambridge University Press, U.K, Una presentación y una discusión muy interesantes de éste y otros principios cosmológicos, como los de Dirac y Milne, pueden encontrarse en la Parte II del libro de Jagit Singh "Teorías de /a cosmo/ogía moderna", Alianza, Madrid,

221 La expansión del Universo condujo a los partidarios del principio cosmológico fuerte a postular una creación continua de materia. La estimación de la velocidad promedio de creación da del orden de un átomo por decímetro cúbico cada mil millones de años. El Profesor Wheeler decía en forma algo irónica que el principio cosmológico fuerte y la hipótesis de la creación continua de materia dieron origen a la "era de la continua creación de teorías" en cosmología. Mientras los principios cosmológicos se utilicen como hipótesis de trabajo, como generalizaciones útiles que pueden y deben ser abandonadas cuando entran en conflicto con los resultados de las observaciones, esos principios permiten el desarrollo de una cosmología de base relativista limitando lo que de otra forma sería un abanico inmanejable de posibilidades a tener en cuenta. Lo que no resulta admisible es volver a ceder a la tentación de constreñir todos los fenómenos hasta acomodarlos en el marco de un principio cosmológico planteado a priori como cierto, en forma independiente de los fenómenos, como en general se hacía en las cosmologías de la Antigüedad y la Edad Media Las ecuaciones de la relatividad generalizada y la constante cosmológica Cuando Einstein aplicó su teoría de la gravitación a la construcción de un modelo del cosmos, no se tenían evidencias de un Universo en expansión. Las estrellas parecían moverse con velocidades pequeñas respecto de c, y en todas direcciones, por lo cual un modelo de Universo estático le pareció lo más adecuado. Supuso que la densidad promedio debía ser positiva y encontró que el problema cosmológico tenía una solución estática como la que buscaba, siempre que en cada punto del espacio existiera una presión negativa constante de magnitud igual a la mitad de la densidad promedio del Universo. 185 Como no había una justificación física conocida para esta acción local, Einstein modificó sus ecuaciones de la gravitación agregando un término, el término cosmoló g ico A gk. Así resulta: Rk - 2 g ft R + A gk = -K Tk La contante A es una constante, presumiblemente universal, pero introducida ad-hoc, conocida como constante cosmológica. Las estimaciones de su orden de magnitud muestran que para el estudio de fenómenos a una escala local, como en el Sistema Solar y en la Vía Láctea, esa constante puede despreciarse. Suponiendo que la constante cosmológica es positiva se puede deducir un modelo de Universo homogéneo, isótropo, finito y estático, compatible con la suposición de que existe en el espacio una densidad promedio de materia diferente de cero. Einstein comenzó a arrepentirse de haberla introducido cuando actuó como árbitro del trabajo de Friedmann 186 en 1922 y constató que era posible resolver las ecuaciones del campo gravitatorio en presencia de una densidad promedio positiva de materia sin 185 Al comienzo pensó que podia justificar un origen electromagnético para esa presión. Ver A. Einstein "El significado de la relatividad2 a edición, Espasa Calpe Argentina, Buenos Aires, 1952, Apéndice II. 186 A. Friedmann "Über die Krümmung des Raumes",Z. Physik, 10, 1922, pp

222 necesidad de introducir el término con la constante cosmológica, suponiendo que la solución no debe ser necesariamente estática. Una vez conocidos los resultados de Hubble y Humason sobre el corrimiento del espectro de las galaxias, Einstein abogó por su eliminación. Pero otros científicos eminentes, como Eddington, estaban convencidos de que la constante cosmológica no debía ser suprimida. 187 Observaciones astronómicas recientes, se interpretan como evidencia de que existe una gran cantidad de energía oscura que estaría acelerando la expansión del Universo. Esto se puede tener en cuenta asignando un valor positivo adecuado 188 a la constante cosmológica en el modelado matemático de la dinámica del Universo. La energía oscura se puede tener en cuenta a través del tensor de energía impulsión, agregando una contribución de la forma T k = K ' Si k, escribiendo las ecuaciones del K campo así: R ik -2-R- s k = -k- (T k + 2 k ) Con el propósito de expresar el tensor de energía-impulsión en forma practicable para el desarrollo de modelos cosmológicos, se aplica el principio cosmológico y se supone que la materia, la radiación y la energía oscura pueden describir en gran escala mediante un fluido relativista, como el considerado en 8.7, pero ahora constituyendo el tiempo-espacio-materia cuando se prescinde de todas las heterogeneidades locales. En ese caso cabría esperar que, si las componentes covariantes de la cuadrivelocidad del fluido oscuro se representan mediante U i (i = 0, 1, 2,3), la densidad de energía oscura por p A y su aporte a la presión del fluido por p K, entonces: 2 1 = ( PA ' c 2 + p J ' U i' ' U 1 - PA ' Si,k Si esta expresión debe ser idéntica a Ti k = A ' s t k, la presión y la densidad del fluido K oscuro deben verificar p K = - A y p A = - = 2. De este modo se anula K c 2 K' c 2 idénticamente el término asociado a las componentes de la cuadrivelocidad, permaneciendo diferente de cero el término que expresa la presión del fluido oscuro. Como una presión negativa corresponde a una tracción, el aporte de la energía oscura al fluido cósmico tiende a separar los objetos en el Universo a gran escala: si se quiere, es una especie de anti-gravedad. Las ecuaciones del campo gravitatorio, teniendo en cuenta la energía oscura, adoptan la A forma: R, k - 1 ' R ' Si, k = - K ' fe k + PA ' c 2 ' Si,k ) 187 Ver, por ejemplo, el libro de S. Serjeant "Oiservationa/ cosmo/osf", Cambridge University Press, U.K, 2010, o la primera parte del libro editado por G. Fraser "T&e new p&ysics in t&e twen/y first centwry", Cambridge University Press, U.K, Algunos físicos especialistas en la teoría cuántica de campos, como Zeldovich, relacionan la constante cosmológica con la energía de punto cero que debería aparecer en todas partes, inclusive en el espacio vacío. Sobre este tema puede consultarse la primera parte del libro editado por G. Fraser "T&e new ^&ysics in t&e twenty first centwry", Cambridge University Press, U.K,

223 El flujo de Hubble y el postulado de Weyl. El tiempo que aparece en las ecuaciones de la teoría generalizada de la relatividad es local y referido a un marco dado, pero en principio arbitrario. El principio cosmológico débil plantea la extensión de la homogeneidad y la isotropía del espacio, tal como se las puede observar localmente efectuando un promedio a gran escala, a la totalidad del Universo. Para ello es fundamental definir un marco de referencia local de modo que la velocidad media de la materia respecto de ese marco sea nula. Ese marco puede considerarse como aproximadamente inercial, aunque solo sea localmente (tanto en el espacio como en el tiempo) en el continuo tiempo-espacio materia. Se denomina marco en co-movimiento con la materia. Si bien el principio cosmológico débil así enunciado es compatible con algún tipo de evolución cósmica promedio, permanece el problema de cómo se conectan los tiempos y los espacios locales de todos esos marcos de referencia. El postulado de Weyl suministra una solución a este problema, basada en las características que parece presentar la expansión del Universo vista en Una vez que por promediado adecuado se eliminan los movimientos peculiares de las galaxias, el movimiento remanente parece ser un flujo expansivo isotrópico que puede denominarse flujo de Hubble. El movimiento peculiar de las galaxias relativo al flujo de Hubble local presenta 189 velocidades generalmente pequeñas y prácticamente aleatorias. La versión más conveniente del postulado de Weyl desde la perspectiva de los modelos cosmológicos, afirma que las líneas de universo de los observadores que se mueven con el flujo de Hubble, denominados observadores fundamentales, forman un haz regular de geodésicas temporaloides que no se intersecan en evento alguno, excepto, tal vez en una singularidad situada en un pasado o en un futuro remotos. El tiempo propio de cada observador fundamental se puede correlacionar con el tiempo propio de cualquier otro de tal modo que es posible sincronizarlos y definir un tiempo cósmico universal asignable a cada evento en el Universo. Como consecuencia es posible identificar los eventos con el mismo tiempo cósmico, definiendo así en el continuo tiempo-espacio-materia unas variedades tridimensionales espacialoides que de acuerdo con el postulado cosmológico deben ser homogéneas e isótropas. Cada una de estas hiper-superficies es el espacio físico correspondiente a un instante de tiempo cósmico (Figura 12.1). 189 El fondo de radiación cósmica fósil de microondas presenta una ligera anisotropía (anisotropía dipolar) a partir de la cual se puede inferir el movimiento del sistema Solar, y la Tierra en particular, respecto del observador fundamental local. El Sol se mueve a 368±2 km/s y la velocidad de la Tierra en su órbita alrededor del Sol es la veinteava parte de esa velocidad. Los movimientos locales respecto de un observador fundamental son del orden de la milésima parte de la velocidad de la luz. La Vía Láctea, considerada en su totalidad, al parecer también se mueve respecto del observador fundamental local, aunque a muy baja velocidad respecto de la velocidad de la luz. Ver, por ejemplo, el libro de S. Serjeant "Observational cosmology", Cambridge University Press, U.K,

224 Figura 12.1: Representación del Flujo de Hubble mediante un tiempo-espacio-materia descomponible en variedades espacialoides (espacio físico) panas y un tiempo cósmico ortogonal al espacio físico. Cerca del vértice que indica el Big Bang se sitúa la fase inflacionaria seguida de la separación de la radiación y la materia. Si el Universo evoluciona en gran escala a medida que transcurre el tiempo cósmico, entonces alguna propiedad geométrica de estas hiper-superficies espacialoides puede variar. Veamos ahora cuál de ellas varía, cómo lo hace y qué significado posee esa variación Modelos basados en la métrica de Friedmann-Lemaitre- Robertson-Walker Del postulado de Weyl se desprende la posibilidad de seleccionar un tiempo universal o cósmico que denotaremos t tal que: ds 2 = c 2 3 í \ di 2 - g z k (t,x 1, x 2,x 3 ) dx z dx k z, k=1 A cada instante de tiempo cósmico le corresponde una variedad tridimensional (el "espacio") cuyo elemento de longitud depende de t y viene dado por la métrica: d/ 2 = g z, k(t,x\x 2,x 3 ) dx z dx 1 z 1 =1 Consideremos la variedad espacial en el instante t = t 0 y seleccionemos dos puntos cualesquiera.(t 0 ) y =(t 0 ). En un Universo dinámico, en un instante t esos puntos se transforman en los puntos.(t) y =(t) de la variedad espacial que representa al espacio físico en el nuevo instante de tiempo cósmico. Suponiendo que estas variedades son homogéneas e isótropas, los cocientes de distancias d(.(t), =(t)) entre pares de puntos correspondientes no deberían depender j, - j d(.(t),=(t)),,, J del tiempo cósmico, es decir,,,, debería ser constante para todo par de p p p ' d (.(t o), e(to)) puntos. 224

225 Este requerimiento puede ser satisfecho si g i k (t, x 1, x 2, x 3 ) = S 2 (t) h ik (x 1, x 2, x 3 ) Aquí S(t) es un cierto factor de escala que caracteriza la dinámica del Universo en el marco de este tipo de modelo matemático. Se halla a partir de las ecuaciones del campo gravitatorio como se verá posteriormente. El intervalo tal como lo determinan los observadores fundamentales queda: ds 2 = c 2 dt 2 -S 2 (t) &., k (x 1,x 2,x 3 ) dx' dx k i, k=1 Ahora identificamos una variedad tridimensional estacionaria cuyo elemento de longitud viene dado por: d/ 0 2 = ^& k (x 1, x 2, x 3 ) dx 1 dx k i k=1 Si ubicamos el origen de coordenadas en donde se halla un observador fundamental O, debido a la hipótesis de isotropía, la variedad presentará simetría esférica en torno al origen. Entonces se pueden introducir, con centro en O, una coordenada radial r y dos coordenadas angulares e,p de modo tal que: dl 0 2 = g 2 (r) dr 2 + r 2 (de 2 + sen 2 d dq 2 ) Pero además de isótropa en O, la variedad es por hipótesis homogénea, y en consecuencia isótropa vista desde cualquier punto. Pero si todos sus puntos son puntos de isotropía, sabemos a partir de los resultados obtenidos en para las variedades 3- D simétricas, que un único escalar K 0 caracteriza la curvatura en todo el espacio, y la función g(r) debe ser igual a g 2 (r) = 1-1 -K0 r 2 Si se introduce un radio de curvatura r 0 y un parámetro que puede tomar tres valores, -1, 0 y +1, la curvatura se puede re-escribir K 0 = r Entonces el intervalo se puede escribir finalmente así, en función del instante de tiempo cósmico y de las coordenadas r, d, p en co-movimiento 190 con la materia local: ds 2 = c 2 dt 2 - S 2 (t ) ( 0 ( r 2 N - 1 N V i 1 - r 0 dr 2 + r 2 (dd 2 + sen 2 e dp 2 ) Si se introduce r = en lugar de r y se define r 0 (t) = S(t) r 0, la métrica queda: r 0 ds 2 = c 2 dt 2 -r o 2 (t) I dr 2 +r 2 (de 2 + sen 2 e dp 2 ) VV 1 - r 2 La coordenada r se toma con origen en cualquier punto del espacio físico, puesto que todos son equivalentes. La coordenada t es el tiempo propio en ese punto. La función no negativa r 0 (t) es una escala cósmica de longitud que permite representa la expansión o contracción del Universo. El parámetro puede tomar tres valores: -1 (espacio curvo abierto), 0 (espacio plano), y 1 (espacio curvo cerrado). La coordenada angular e varía entre 0 yn, mientras que la coordenada angular p varía entre 0 y2n. 190 Elegimos un marco de referencia para cada punto del espacio de tal modo que se mueva con la materia allí localizada: la velocidad de la materia en este sistema de referencia intrínseco es cero por definición. 225

226 En estas coordenadas el tensor métrico posee las componentes: g 00 = c 2 = g22 = -t2 g33 = -t2 sen2e gil = 0 1 * r Esta (pseudo)-métrica se denomina métrica estándar. Una métrica equivalente 191 fue descubierta por Friedmann en 1922 y re-descubierta por Lemaítre en Tanto Friedmann como Lemaítre partieron de las ecuaciones de la teoría general de la relatividad para construir la métrica estándar y asumieron que no se podía desvincular la una de las otras. Pero en 1935, Howard Robertson y Arthur Walker demostraron que la métrica estándar es consecuencia de postular un continuo tiempoespacio homogéneo e isótropo. Cuando = 0, expresando el término relacionado con las coordenadas espaciales en su forma cartesiana, la métrica estándar se reduce a: ds 2 = c 2 dt 2 - S 2 (t) (dx 2 + dy 2 + dz 2 ) La presencia de un factor de escala que puede variar en el tiempo tiene como consecuencia que el tiempo-espacio tomado como un todo pueda estar curvado, aunque el espacio tridimensional asociado a las coordenadas de posición no lo esté. Un factor de escala cambiante hace que el tiempo-espacio curvado correspondiente a la 192 métrica estándar sea muy diferente al espacio plano de Minkowski cuya métrica es, como sabemos: ds 2 = c 2 dt 2 - (dx 2 + dy 2 + dz 2 ) Para determinar la función S(t) o su equivalente r 0 (t) = S(t) r 0 (t 0 ), es necesario un modelo de gravitación. Antes de considerar cómo varía esta función con el tiempo, conviene fijar el instante y analizar algunos aspectos de las geometrías no euclidianas del espacio físico resultante. 191 Ver, por ejemplo, el libro de H. Bondi "Cosmology", capítulo 10, Dover, New York, Con el fin de estudiar la curvatura del tiempo-espacio provocada por un factor de escala cambiante, consideraremos un caso simplificado de la métrica estándar, a saber: ds 2 = c 2 dt 2 - S 2 (t ) dx 2 Poniendo x 0 = c-í x 1 = x g 00 = 1 g u =-S 2 (x 0 ) g ik = 0 (si i * k), entonces las componentes contravariantes del tensor métrico verifican g 00 = 1 g 11 = 1 S (x ) ^ g ik = 0 (si i * k). A partir de las componentes del tensor métrico se pueden hallar los coeficientes de conexión: r%0 = 0 r 0 01 =r 0 10 = 0 r V =-! g 00 ^ = S r 1 00 = 0 rv =1% = - g 11 = dx 0 dx dx 0 S dx 0 r 1 11 = 0 A partir de los coeficientes de conexión, aplicando la fórmula para el tensor de curvatura de Riemann-Christoffel vista en 9.5.4, se obtienen las componentesr 1 -ii. En este caso la única componente W 2 cí 0} no nula (a menos de simetrías) depende del tiempo y es: R ( 0 x )= 11 - r 1 10 rv = S( 0 x ) d S dx 0 (dx 0 ) 2 226

227 Estudio estático de las geometrías a partir del término espacial del intervalo. Distancias propias y parámetro de Hubble. Si fijamos un instante t y si introducimos el factor de escala /(t) multiplicando la coordenada radial y continuamos llamando r alo que ahora es /(t) r, el elemento de distancia espacial se puede escribir así, con r o (t) = /(t) r o : d/ 2 = 1 - e.2 Y ro 2 (t) dr 2 + r : (d d 2 + sen 2 d dp 2 ) Consideremos la superficie de una esfera centrada en el origen y correspondiente a un valor constante de la coordenadar. El elemento de área esr 2 - send-dd-dp, de modo que su área es igual a 4n - r 2. En el caso de una circunferencia con centro en el origen de coordenadas (caracterizada por un valor de rconstante) y situada en el plano p = o, el elemento de longitud es d/ = r - dd de modo que su longitud es igual a2n - r. t r dí No obstante el radio p de estas figuras no es igual a r sino a I i 1 -e ro 2 (t) Se ve que si e = 1 (espacio curvo cerrado), entonces p es mayor que r; si e = o (espacio plano) entonces p entonces p es menor que r. es igual que r; y si e = -1 (espacio curvo abierto) Estas variedades espaciales 3-D son simétricas respecto del origen de coordenadas, del tipo que estudiamos en detalle en el capítulo 9 (en las sub-secciones 9.4.6, y 9.5.4), con un elemento de línea del tipo d/ 2 = g 2 (r)- dr 2 + r 2 - (dd 2 + sen 2 d- dp 2 ) Como en este caso se trata de un espacio isótropo en todas partes: g(r) = e Entonces la curvatura de la variedad 3-D, que representa al espacio físico en este modelo, se caracteriza por el mismo escalar en todos los puntos considerados en el mismo instante de tiempo universal, pero esa curvatura uniforme del espacio físico e puede variar con el instante de acuerdo con la fórmula: >(t) =... ro 2 ( t ) Espacio esférico Consideremos el caso para el cual e = 1. En ese caso la distancia radial al origen p viene dada por la fórmula: p = I V dí f r ^ = ro (t)-arcsen í 2 v r o (t) y ro 2 (t) Poniendo = senx el elemento de longitud y la distancia al origen vienen dados en función de x * d/ 2 = r o 2 - (dx 2 + sen 2 x - (sen 2 d - dp 2 + dd 2 )) p = ro- X 227

228 r Como debe estar comprendido entre o y 1, el ángulo x debe variar entre o y 2n. r o En términos de la coordenada angular x el área de una esfera de radio p = r o - x es / e = 4n- r 2 = 4n- r o 2 - sen 2 x y la longitud de una circunferencia como la considerada previamente es / a = 2n - r = 2n - r o - senx. Comosenx = x-6-x 3 + (x 3 ), donde o(% 3 ) tiende a cero más rápido quex 3, la longitud de la circunferencia se puede expresar así, cone a = 2n.r o - o(x 3 ): /a = 2n-ro-Ix- 1 -x 3 + ^(x 3 ) = 2n-ro -x- n 3 -(ro 3 x 3 2 ) + ea v y 3 r o Entonces, en términos del radio p = r o - x, obtenemos finalmente la fórmula: t n 1 t / a = 2n- p ^r - p 3 + e a Comparando con la fórmula que relaciona la longitud 3 r (í) o de la circunferencia con su radio y con su curvatura de Gauss, vista en 9.1.2, t n 13 / a = 2 n - p - y p +e a resulta que para e = 1 el espacio posee en el punto considerado la curvatura de Gauss positiva >(í) = 1,. ro 2 (í) El área de una superficie esférica / e = 4n-r 2 = 4n-r o 2 -sen 2 x, de radiop = r o x, ~ 2 n crece desde o cuando x = o (p = o) hasta un máximo igual a / e = 4n - r o para x = ~ t n t (p = r o - ) y luego decrece hasta anularse nuevamente, ahora para x = n (p = r o - n). Este comportamiento de las superficies de las esferas con centro en un mismo punto del espacio, en tres dimensiones, es análogo al comportamiento de las circunferencias contenidas en una superficie esférica (que es un espacio bidimensional curvado) y centradas en un mismo punto, a medida de que el radio aumenta, medido por las longitudes de los arcos de círculo máximo (es decir de las geodésica en la esfera) que va del centro hasta la circunferencia. La longitud primero aumenta hasta alcanzar un máximo en el ecuador y luego disminuye hasta anularse al alcanzar el polo opuesto al puntos tomado como centro. Si introducimos un espacio euclidiano de 4 dimensiones de coordenadas cartesianas ortogonalesx 2,x A, el espacio físico que corresponde al caso e = 1 en la métrica de Friedmann-Lemaítre-Robertson-Walker puede interpretarse como una cáscara esférica de 3 dimensiones, de radio r o, centrada en el origen de ese espacio y dada por la ecuación x 2 + x^ + x x4 = r o 2. Como vimos en 9.4.5, introduciendo un sistema de coordenadas esféricas la cáscara de radio r o se puede representar así (x entre o y 2} 6 entre o y n; (p entre o y 2n ): x x = r o - senx' sen6 - cos p x 2 = r o - senx' sen6 - senp x 3 = r o - senx' cos6 x4 = ro -cosx 228

229 Por tanto es una variedad finita, cerrada y en sí misma ilimitada (recorriéndola por adentro no se encuentra una frontera). Partiendo de un punto cualquiera (tomado como polo), el punto más alejado de la variedad respecto de este polo se encuentra a la distancia p = r 0 n, en el polo opuesto. El volumen de esa cáscara, o sea, el volumen del cosmos según este modelo de Universo cerrado, es V D (t) = r 0 3 (t^ JJ J sen X^ sene dq^ de dx = 2n 2 r 0 3 (t^ El volumen de una región de radio p = r 0 x 0 es V(x 0 ) = 2n r 03 ^Xo - 2 sen(2 x 0 ) Espacio hiperbólico Cuando = -1, la distancia radial al origen viene dada por la fórmula: r P=J- 1 í r I : r 0 (t) arcsenh 1 + v r 0 (t) y r0 2 (t) r t Introduciendo = senhx, se obtiene nuevamente p = r 0 x Pero ahora x puede variar entre 0 y + r 0. Es un universo abierto. El área de una superficie esférica de radio p = r 0 x es S e = 4n r 2 tiende a infinito cuando x crece. El volumen de este Universo es infinito. = 4n r 0 2 senh 1 x, y Como senhx = x + x 3 + o(x 3 ), donde o(x 3 ) tiende a cero más rápido que x 3, la longitud de la circunferencia l c = 2n r = 2n r 0 senhx se puede expresar así, con c = 2nr 0 2 n r ox o( x 3) ) : lc = 2n r r fx \Z + + ^x- 3 x + o(x + o(x 3 )! = )j 2nr = 2nr X x +^ + - ^ fc 3 ( r a x 3 x ) + c Comparando nuevamente con la fórmula que relaciona la longitud de la circunferencia con su radio y con su curvatura de Gauss, l c = 2n p - 3 > p + c resulta que para = -1 el espacio posee en el punto considerado la curvatura de Gauss negativa > (t ) = - é. Si introducimos un espacio euclidiano de 4 dimensiones de coordenadas cartesianas ortogonalesx j3 x 2,x 3,x 4, el espacio físico que corresponde al caso = -1 en la métrica de Friedmann-Lemaitre-Robertson-Walker puede interpretarse, como vimos en 9.4.5, como una variedad hiperbólica de 3 dimensiones, dada por la ecuación x 1 + x 2 + x 3 - x 4 = r 0. Introduciendo un nuevo sistema de coordenadas x?e,9 se puede representar así, teniendo en cuenta que ahora x varía entre 0 y + mientras que las coordenadas angulares varían como de costumbre, es decir e entre 0 yn; q entre 0 y 2n : x 1 = r^cosh x^ sene cosq x 2 = r 0 cosh x^ sene senq x 3 = r^cosh x^ cose x 4 = r 0 senhx 229

230 Puesto que el coseno hiperbólico y el seno hiperbólico son funciones no acotadas (tienden a cuando x tiende a ) % tenemos un espacio que, además de uniformemente curvado e ilimitado, es un espacio abierto porque nos podemos alejar tanto como queramos a partir de un punto % puesto que a diferencia de lo que ocurre en el caso con = +1% ahora no hay una cota superior para las distancias entre 193 puntos del espacio: el volumen del espacio es infinito. Si la coordenada radial está acotada r < r 3 % el volumen de la región espacial así definida se puede calcular mediante la fórmula:? 3 (í ) = r! o (í)- r 3 jj n 2n j se«& 2 %-se«o-dp-do - dx = 2n 2 - r 3 o (í)- 1 r 3 (í) I r 3 (í) 2 r 3 (í) 1 Si se supone una expansión homogénea cabe esperar que /o (ím ro (í) 2 ro (í) y 3,, permanezca constante. r ( í ) Espacio plano Cuando = o % p = r y se tiene el espacio euclidiano tridimensional % es decir el espacio ordinario en el que organizamos nuestras percepciones. Parámetro de Hubble La distancia entre dos observadores en co-movimiento local con la materia% cuando uno de ellos se encuentra situado en el origen% para el mismo instante de tiempo cósmico viene dada por p. Se mide a lo largo de la geodésica que parte del origen en una dirección especificada por los ángulos O y p. r r o (í) dz Cuando - -r se mantiene constante % de la fórmula p(í) = r o (í)- i. = se r o (í) o V1 - -Z 2 desprende que la distancia p entre los observadores aumenta con una velocidad d f 1 dro (í) 1 z j í A - 1 p dí = p(í) = H(í)- p(í) donde H(í) = p- d ro o (í) se conoce como v ro ( í ) dí J ro ( í ) dí parámetro de Hubble. La velocidad radial de separación de dos observadores en comovimiento local con la materia resulta proporcional a su distancia y a ese parámetro característico de la expansión del Universo% expresado en términos de la velocidad relativa de variación del radio de curvatura del modelo de Universo. Se aplica a los tres casos posibles: = 1 (espacio curvo cerrado) = o (espacio plano) y si = -1 (espacio curvo abierto) Estudio a partir de la métrica completa. El modelo estándar A-CDM Para hallar la función r o (í) que determina la curvatura del modelo de Universo se sustituyen las componentes del tensor métrico correspondiente a la métrica estándar (métrica de Friedmann- Lemaitre-Robertson-Walker) en las ecuaciones del campo gravitatorio. Pero antes de hacer esto es conveniente efectuar el cambio de coordenadas r o (í) r 193 Como se mostró en 9.4.5% si se elimina una de las coordenadas espaciales haciendo X 3 = o% la ecuación de la variedad se reduce a Xj + X 2 X 4 = r o que en un espacio euclidiano tridimensional corresponde a la superficie conocida como hiperboloide de una hoja. 230

231 espaciales visto en y también al final de 9.5.4, que permite una representación conforme de la variedad espacial en E3, poniendo r = 1 -: r ^ 4 dl = A 2 (dr 2 + r 2 1 do 2 + r 2 sen 2 0 dq 2 ) A 2 (r 1 ) = r2 1 + ^ 4 La métrica de Friedmann-Lemaítre-Robertson-Walker se lleva así a la forma canónica: ds 2 = c 2 dt 2 -r 2 (t) A 2 (r 1 ) (dr r 1 2 (do 2 + sen 2 O dq 2 )) Aquí r O (t) es un factor global de escala cósmica, A 2 (r 1 ) = 1 - es un factor local de r ^ 4 curvatura y dr 2 + r 2 (do 2 + sen 2 O dq 2 ) es una métrica euclidiana en el espacio tangente en el punto considerado de la variedad tetra-dimensional definida por la métrica. La única función desconocida es la dependencia del tiempo del factor de escala cósmico. Cuando r 1 se aproxima a cero, A 2 (r 1 ) se aproxima a 1, y r 1 se aproxima a r. El elemento de línea correspondiente a la métrica de Friedmann-Lemaííre-Robertson- Walker se aproxima al elemento de línea: ds 2 = c 2 dt 2 - (dr 2 + r 2 do 2 + r 2 sen 2 O dq 2 ) Este último define un espacio de Minkowski (marco de referencia inercial) tangente en el origen a la variedad curvada. 1 Para hallar la función r O (t) que determina la curvatura del modelo de Universo se sustituyen las componentes del tensor métrico correspondiente a la métrica estándar puesta en su forma canónica, en las ecuaciones del campo gravitatorio: 1 8n Gr,k = E, 1 -! E^g', 1 =-K T'' k (i,1 = 0,1,2,3) K = G Como se supone que el observador se mueve localmente junto con el fluido cósmico homogéneo e isótropo, caracterizado por una densidad propia y una presión uniformes p(t) y p(t) respectivamente, las componentes del tensor de energía impulsión pueden escribirse así: T 0-0 = p(t) c 2 T 1 1 = T 2 2 = T 33 = p(t) T h 1 = 0 si i * 1 Sustituyendo en las ecuaciones para el campo gravitatorio esta versión del tensor de energía impulsión junto con las componentes del tensor métrico correspondiente a la métrica de Friedmann-Lemaítre-Robertson-Walker, después de numerosos cálculos se obtienen las siguientes ecuaciones que relacionan el factor de escala con la presión p y la densidad p del Universo considerado como un fluido homogéneo e isótropo 194 : 194 E. Harrison "Cosmology: the science of the Universe", Cambridge University Press, Londres, L. Landau y E. Lifchitz "Teoría del campo", Reverté, Barcelona,

232 C 2 1 d 2 r 0 (t) =_ 4n- 5. fp( t ) )N ' ^(t r 0 (t) dt J 3 r 2 0 (t) r 0 (t) dt 2 3 v c I 1 dr 0 (t) 1 2-8n ' 5 p( t ) V o Estas ecuaciones pueden denominarse primera y segunda ecuación de Friedmann- Lemaítre. La interpretación actual de los parámetros del tensor de energía-impulsión (p y p) es en buena medida diferente a la interpretación que se les daba en los primeros modelos cosmológicos de Einstein, de Sitter, Friedmann y Lemaitre, sobre todo debido a la inclusión de la materia oscura y de la energía oscura. En este capítulo revisaremos una familia de modelos conocidos como modelos de Friedmann-Lemaitre-Robertson-Walker. A diferencia de lo que se hizo cuando se construyeron los primeros modelos cosmológicos, en la formulación de los modelos modernos se tiene en cuenta una mezcla de fluidos cósmicos, cada uno con su ecuación de estado. Con estos modelos más sofisticados se obtienen resultados al parecer mejores en relación con la posible edad del universo y se pueden describir detalles de la dinámica de expansión que quedan fuera del alcance de los modelos antiguos. El fluido cósmico se modela como una mezcla aditiva de tres fluidos ideales componentes: el formado por la materia (incluyendo la materia ordinaria y la materia negra) de densidad p m (t) y presión p m (t), el formado por la radiación de densidad P r (t)y presión p r (t), y el formado por la energía negra de densidad p A y presión p A. Entonces: p(t ) = Pm (t ) + p (t ) + PA y pt ) = ^ (t) + P (t) + PA Para cada uno de los tres fluidos se introduce una ecuación de estado del tipo que corresponde a un fluido perfecto, p = : p.c donde P es la presión, p es la densidad tal como se definen para un marco de referencia que se mueve localmente con el fluido y : es un parámetro a-dimensionado. Para la materia : = : m toma el valor 0 si se considera que se comporta como un polvo, o de lo contrario adopta un valor positivo. En lo que sigue asumiremos que : m = 0. Para la radiación : = : r = 3. Para la energía oscura 195 : = : A = _1. Como consecuencia de estas suposiciones: p(t ) = Pm (t)+ Pr (t)+ Pa = 0 + Pr (t) C 2 _P K -C A veces se supone que la energía oscura se manifiesta como un fluido cuya ecuación de estado adopta la forma p= = p= -c 2 con < _3. Una vez que la dinámica del cosmos en expansión sale de las etapas en las que domina la radiación (primero) y domina la materia (después) el Universo entraría en una etapa cuya dinámica es dominada por la energía oscura, acelerando su expansión si en la ecuación de estado de la materia oscura se verifica < _. A un fluido como éste algunos cosmólogos se complacen = 3 en denominarlo quintaesencia, en recuerdo del quinto elemento del antiguo modelo cosmológico, que se suponía era la materia de la que se encontraban hechos los astros y no tenía equivalente en el mundo sublunar que habitamos. 232

233 Teniendo en cuenta esta fórmula que expresa la presión en términos de las densidades, la segunda ecuación de Friedmann-Lemaítre, también denominada ecuación de la aceleración, se reduce a la siguiente: 1 d 2 r 0 (t) 4n G \ \ x 0M * = (t)+ ( " P m ^ P ( ' )- Como la densidad de energía oscura se considera positiva, de la segunda ecuación de Friedmann-Lemaítre se desprende que esta forma de energía tiende a acelerar una expansión del Universo, mientras que el efecto de las densidades positivas tanto de la materia como de la radiación es desacelerarla. La denominada materia oscura fría, a diferencia de la energía oscura, se supone que se comporta como la materia ordinaria desde el punto de vista de las interacciones gravitatorias y tiende a frenar una expansión del Universo. La primera ecuación de Friedmann-Lemaítre puede escribirse en términos de la suma de las densidades de los tres fluidos: f V R 0 1 dr 0 (t) ^2 8n G, _ ÍA _ ^ c 2 (Pm (t) + P r (t ) + P A ) - (t) dt j 3 r0 2 (t) 1 dr (t) Como p- = H(t) es el parámetro de Hubble introducido al final de , esta r 0 (t) dt 2 j r.,, c 8n q^t- G n í /x 3 i Hu 2 2 ÍA^\ (t)' ecuación se puede reformular así: = p(t)- (t) 8n G j 3 H 2 (t) Definiendo una densidad crítica p c (t) = resulta que el valor de y por tanto, 8n G de acuerdo con esta clase de modelos, la geometría del Universo, depende de si la densidad total del fluido cósmico es mayor, igual o menor que ese valor crítico. Se introducen los denominados parámetros de densidad para la materia, la radiación y la energía oscura: fí (t^^tt fír (t) = P ^ ^A(t)= P c (t) ^ P c (t) A W P c (t) c 2 Como 2,. ^r = fí (t) + fí r (t) + fí A (t)-1, resulta finalmente lo siguiente, r (t) H 2 (t) denominando espacio físico a las hiper-superficies espacialoides del tiempo-espaciomateria: Si fí m (t) + fí r (t) + fí A (t)> 1 el espacio físico es finito (cerrado) y con curvatura positiva (caso esférico, = +1). Si fí m (t) + fí r (t) + fí A (t) = 1 el espacio físico es infinito (abierto) y con curvatura nula (caso plano, = 0). Si fí m (t) + fí r (t) + fí A (t)< 1 el espacio físico es infinito (abierto) y con curvatura negativa (caso hiperbólico, = -1). Pa 233

234 Q >1 Q 0 <1 2 0 =1 Figura 12.2 Tres geometrías posibles para el espacio físico según el valor del parámetro Q ( t )= p m + p r + p A. Para representarías se utilizan variedades bidimensionales inmersas en E 3. 0 pc En cada una de esas variedades se indica un triángulo formado por geodésicas, cuya suma de ángulos se relaciona con la curvatura local y con el área del triángulo como se mostró en Es posible relacionar las densidades de materia y de radiación en un instante de tiempo cósmico con el radio de curvatura del Universo r 0 (t). Consideremos un volumen propio muy grande de espacio físico en un instante de tiempo cósmico t = t 0, cuando las densidades de materia y de radiación son p m (t 0 ) y p r (t 0 ). El radio del Universo en ese instante inicial es r 0 (t 0 ). En otro instante de tiempo cósmico el radio será r 0 (t) y el volumen propio considerado habrá variado respecto del inicial en un factor a W v V r 0 (t 0 ) J Si, como sugirió O. Heckmann 196, la materia y la radiación no se inter-convierten en cantidades significativas, el volumen modificado debe contener en su interior el mismo número de partículas de materia, cada una con su propia masa no afectada por la expansión o contracción uniforme. Entonces cabe esperar que la relación entre las densidades pm ( t ) y pm (t0) sea: pm ( t ) = pm ( t0 ) ' 0 (t0 V-Q ) 1 r (t) V0 En el caso de la radiación que ocupa el volumen considerado, su densidad inicial p r (t 0 ) se modifica en un factor f r (t) V r 0 (t 0 J ) Y debido a un cambio en el radio de curvatura del Universo, por el siguiente motivo. La densidad de la radiación se define a partir de su O. Heckmann "2&eor/en der >osmo/og/'e", Springer-Verlag, Berlín,

235 densidad de energía e r (t 0 ) como p r (t 0 )= r (! 0), puesto que, a diferencia de las c2 partículas de materia, su densidad de reposo es nula. La densidad de energía de la h c radiación se compone de las contribuciones de los cuantos cuya energía es h / =. Al variar las dimensiones del volumen de una porción muy grande del Universo, varía í rm ^ la longitud de onda X de modo que X(t) = X(t 0 ) V r 0 (t 0 ) j Entonces la energía de los cuantos varía como cósmico t 0 al instante t. í rm_ V r 0 ( t ) j j desde el instante de tiempo El número de corpúsculo de radiación por unidad de volumen varía como r (') v V' r 00V-0/j (t 0 ) Combinando el efecto sobre la densidad con el efecto sobre la energía de los corpúsculos se obtiene: p í rcm r (t) = p r (t 0 ) V '0 w r 0 (t) De las dependencias entre las densidades de materia y de radiación y el factor de escala cósmico, en ausencia de inter-conversión entre materia y radiación y de transferencia de j v 4 calor entre las regiones consideradas, se deduce que 197 : Pr (t) Pm (t) ' Pr (t 0 ) V Pm (t 0 ) j = 1 Teniendo todo esto en cuenta, se puede plantear una versión simplificada de las ecuaciones de Friedmann- Lemaítre: f 1 dr 0 (t) ^2 = 8n G V r 0 (t) dt j 3 Pm (t 0 ' zóctc) ^ V r 0 ( t ) j + Pr ( t0 ) ^ zóctc) ^ V r 0 ( t ) j + PA c rw) 1_ d 2 r 0 (t),(t) dt 2 4n G 3 Pm ( t0 f r (t0 )Y, o. u ) í r (t0)' V r0 (t) j +! P r (t0 ) - 2-PA V r0 (t) j 4 Esta forma simplificada de las ecuaciones de Friedmann-Lemaítre permite una 198 descripción analítica de algunos casos límite de la dinámica global del Universo. 197 R. Alphery R. Herman "Evolution of the Universe", Nature, volumen 162, 1948, pp Una descripción más completa de las posibles soluciones de la familia de modelos de Friedmann- Lemaítre-Robertson-Walker requiere completar los detalles de cada modelo específico y emplear métodos numéricos en un contexto de simulación digital dinámica. 235

236 Modelo paño con radiación dominante. Supongamos que = y que las densidades de materia, de radiación y de energía oscura en el instante de referencia t = t 0 no se anulan. r ( t ) Cuando 0,. es lo bastante pequeño, la primera ecuación de Friedmann-Lemaitre se r 0 (t 0 ) puede aproximar por ésta: 1 //r 0 (t) _ l8n-5 pr (t0 ) 0 (t) /t V 3 v r 0 (t) y La solución es de la forma: r 0 (t)~ r 0 (t 0 ) H(t 0 ) t con H(t 0 ) = ^j^ 5 p r (t 0 ) Entonces: = H(t) = r 0 (t) /t 2 t Se suele aceptar que, luego de una fase de expansión extraordinariamente rápida, denominada inflación, que se considera más adelante en este capítulo (en la sección 12.5), la dinámica del Universo estuvo dominada por la radiación, hasta que pasó a estar dominado por la materia y sobre todo por la energía oscura. Modelo paño con materia y energía oscura dominantes: el modelo estándar A- CDM. Cuando,(t) r 0 (t 0 ) es lo bastante grande como para que el término de radiación pueda ser despreciado, la primera ecuación de Friedmann-Lemaitre con = 0 se puede aproximar por ésta: v0 (t) Zr-0 (t) ^ /t y y 8n 5 3 p m (t 0 ) r ZcCtc) 1 v r 0 (t) Si el término asociado con la energía oscura pudiera despreciarse frente al término correspondiente a la materia, se obtiene un modelo como el propuesto en 1932 por y + PA EinsteinypordeSitter: r0(t). r0(t0)^[^,^3 H (t0 ) = 8n 5 (, p m ( t0 ) 1 =H (t r 0 (t) /t 3 t Este modelo describe una segunda etapa de evolución del Universo, con una dinámica dominada por la materia. La evidencia acumulada a partir de 1980 condujo a su abandono, a fines del siglo XX, y su sustitución por modelos que daban prioridad a los efectos debidos a la energía oscura. Cuando,(t) ' 0 ( T 0 ) crece lo suficiente, se pueden despreciar los términos asociados tanto con la radiación como con la materia. 199 Aunque las hipersuperficies espacialoides que forman el espacio físico posean curvatura nula, como en este caso en el cual = 0, el tiempo-espacio-materia tetra-dimensional está curvado debido al factor r 0 2 (t) que aparece en la métrica de Friedmann-Lemaitre-Robertson-Walker. 236

237 En ese caso la primera ecuación de Friedmann-Lemaítre con = 0 se puede aproximar f 1 dr 0 (t) ^ Í8n-G por: PA V (t) dt r 0< y 3 La solución es una exponencial: r 0 (t) ~ r 0 (t 0 ) exp[h(t 0 ) (t -1 0 )] donde 8n G H (t ) = H (t 0 ) = PA 3 Este modelo no resulta adecuado para describir la etapa actual del Universo, pero podría describir un futuro lejano, si la expansión continuara hasta reducir las densidades de materia y radiación a niveles despreciables en comparación con la densidad de energía oscura. Es matemáticamente idéntico al modelo propuesto por de Sitter en 1917, aunque su significado físico es diferente. También ha sido utilizado para describir la etapa inflacionaria, extremadamente breve, una vez surgido el Universo a partir de lo que se suele denominar una singularidad en el modelo del Big Bang. El modelo matemático más simple de la dinámica cósmica, que cuenta con la mayor aceptación en el momento actual, es el modelo plano que involucra a la vez el aporte de la materia (ordinaria y oscura) y de la energía oscura. Como la materia oscura (cold dark matter) y la energía oscura (a través del parámetro A) dominan la cinética, se lo conoce como modelo A-CDM. Para deducir el comportamiento temporal del factor de escala se integra por separación de variables la ecuación del modelo plano con materia oscura y energía oscura dominantes: 1 dr, (t) ^ V r 0 (t) dt y ^ 8n G 3 Pm (t 0 3 r (tp) 1 + PA V r 0 ( t ). Se supone que en el instante inicial r 0 (0) = 0. Se obtiene así la siguiente fórmula para el factor de escala del Universo:,(t) > ( t 0 ) = / (t ) = P,, (t 0 ) PA senh 3 ^/ón G Pa En una primera etapa, posterior a la fase inflacionaria (fase que este modelo no describe) la expansión se produce desacelerada. En una segunda etapa se acelera y finalmente la expansión se aproxima a una exponencial. (Figura 12.3)

238 Figura 12.3 Evolución del factor de escala según el modelo estándar. Si se pone t = to en la fórmula para el factor de escala% éste vale 1 y se puede despejar una fórmula para to % a saber: t o = G p A arcsenh f _PA^_ ^ P m ( t o ) Si el instante to se toma en el presente y el origen de los tiempos en una singularidad inicial en el modelo matemático que corresponde al denominado Big Bang% entonces to debe ser la edad actual del Universo% que el modelo predice a través de la fórmula que acabamos de deducir. Valores para los parámetros del modelo cosmológico Hay un cierto consenso tanto acerca de to % como acerca de los valores de los parámetros de densidad y acerca del parámetro de Hubble % a saber 2 : t o =(13.7 ± o.2)xlo' anos a m (t o)«o.27 ± o.o# a r (t o)«o.oo a A (t o)«o. 73 ± o.o4 1 d r o ( t o km ) = H(to )=(7o.4 ± 1.5) (t o s Mpc ) d t r o Estos valores implican que el valor más verosímil del parámetro de curvatura es cero. De ser así% el Universo tendría una geometría plana% y la densidad total del fluido cósmico estaría próxima al valor crítico p c o = 3 H ^ ) 8nG próximo a 1 c 1o _26 kg/m 3. % valor que a su vez parece estar Los modelos globales% basados en el principio cosmológico% intentan una descripción del comportamiento promedio del Universo% a gran escala% ignorando la riqueza de 2 S. Serjeant"Observational cosmology"% Cambridge University Press% U.K% 2o1o. W. Freedman y E. Kolb "Cosmology" en G. Fraser (Ed.) 'The new physics in the twenty first century"% Cambridge University Press% U.K% 2oo9. 238

239 estructura y las heterogeneidades a escalas más pequeñas. En este sentido se parecen al modelo de geoide de la Tierra, que ignora los detalles del relieve cada lugar. Al igual que el geoide, suministran un escenario sobre el cual los detalles locales pueden insertarse y ser estudiados. Antes de considerar algunos de los aportes de la teoría de la relatividad al estudio de los detalles locales del cosmos, consideremos nuevamente el corrimiento al rojo del espectro de las galaxias lejanas Corrimiento al rojo cosmológico La expansión del Universo produce un corrimiento al rojo del espectro observado de las galaxias que no se explica ni por el efecto Doppler de la relatividad restringida, estudiado en 8.4.1, ni por el efecto local de los campos gravitatorios, estudiado en Supongamos que un observador se encuentra en una posición radial fija r observador = 0 respecto de un marco de referencia con la métrica de Friedmann-Lemaítre-Robertson- Walker. En un punto situado en r fuente = r f existe una fuente que emite ondas luminosas que se dirigen hacia el observador y llegan a él. Supongamos que en un instante t f la fuente emite la cresta de una onda, de longitud A f, y que un receptorjunto al observador detecta es cresta en el instante t r. Pese a que el continuo tiempo-espacio-materia se idealiza como un medio homogéneo e isótropo, la métrica cambia con el paso del tiempo debido a que el factor de escala se modifica. Entonces la longitud de onda medida por el observador en el origen del marco de referencia es A r en vez de A f. Para el movimiento radial de la luz se tiene: ds 2 = c 2 dt 2 -r 2 0 (t) A 2 (t) dr 2 = 0 A(r) = r Entonces, separando variables, teniendo en cuenta que la luz viaja hacia el origen de coordenadas espaciales, e integrando resulta: tr dt 0 c J p- = - J A(r) dr t/0 (t) La siguiente cresta de onda es emitida por la fuente en el instante t f + A f c, una vez transcurrido un período de oscilación que en ese lugar es igual a. c A f Esa nueva cresta A r es recibida en el instante t r + en el lugar donde se encuentra el observador. Entonces c A r t r + dt 0 se tiene: c- J (-) = -JA(r ) dr Restando miembro a miembro las ecuaciones t f +- A r 0 A r t r + para la primera y segunda cresta: f - f ^ = 0 Esta ecuación se puede Ar r (t) 0 A/ V / Í r 0 t f (t) 239

240 U t f + l f - reescribir así: J ~ir\ = í ~T\ Ahora bien, como las integrales se extienden a t r r 0 (t ) tf r 0 (t ) intervalos de tiempo cuyas extensiones son iguales al período de la oscilación recibida y al período de la oscilación emitida, respectivamente, y como cabe suponer que el factor de escala permanece prácticamente constante durante esos intervalos de tiempo, se puede escribir: tr tf ^ c. í c J L = c. í c _dl = Á f Entonces: -h = c l c 1 nonces: r (t) r (tr) ro (t) r (t r ) Reordenado se obtiene para el corrimiento C de origen cosmológico: 1 + C = h = rjk) Á f r o ( t f En un Universo en expansión r 0 (t r ) es mayor que r 0 (t f ), debido a lo cual el corrimiento debe ser al rojo. Además, cuanto más lejana se encuentra la fuente, mayor va a ser r 0 (t r ) respecto der 0 (t f ), y más intenso va a resultar el corrimiento cosmológico. Como lo resume Steven Weinberg: "El incremento en la longitud de onda desde la emisión hasta la absorción de la luz no depende de la velocidad de cambio del factor de escala cosmológico en los instantes de la emisión o de la absorción, sino del incremento del factor de escala en el período completo que va de la emisión a la absorción." 201 De acuerdo con el modelo cosmológico estándar, se ve que el corrimiento al rojo C es el mismo para todas las longitudes de onda, y por tanto para todas las frecuencias, suponiendo los mismos instantes de emisión y de recepción El modelo cosmológico A-CDM y la teoría del Big Bang. La suposición básica de los modelos cosmológicos revisados precedentemente es que el Universo está compuesto por una distribución regular, homogénea e isótropa de energía en forma de radiación y partículas de materia. En el mejor de los casos esta es una aproximación que se cumple en promedio a partir de una escala de 300c 10 6 años-luz. Permite introducir un sistema de observadores en reposo respecto de la materia adyacente, en movimiento libre de fuerzas en un marco de referencia de Minkowski local. Para cada uno de estos observadores, las leyes físicas que se aplican en las correspondientes adyacencias son las que se verifican para el tiempo-espacio plano. Estos observadores, que están en co-movimiento con la materia local, miden el tiempo local. Se supone posible sincronizar los relojes de todos los observadores en co-movimiento mediante la siguiente regla: cuando observan que la densidad de la materia que los rodea toma determinado valor, entonces ajustan sus relojes para que se lea un determinado instante. ) Áf 201 S. Weinberg "CosmologyOxford University Press, New York, 2008, p

241 La simetría implícita en el postulado cosmológico asegura que los relojes permanezcan sincronizados. Se admite que con este procedimiento se puede definir un tiempo universal como el que aparece en la métrica de Friedmann-Lemaííre-Robertson-Walker. La distancia d entre dos observadores, cada uno en co-movimiento con la materia de su entorno, se define en la variedad de Riemann de curvatura variable con el transcurso del tiempo universal, y si la expansión es homogénea es isótropa entonces d(t) = S(t) d(t 0 ) r ( t ) donde aparece el factor de escala cosmológico S(t) =,, el mismo para cualquier r 0 (t 0 ) par de observadores. Una analogía que ayuda a intuir la expansión del Universo consiste en imaginar un globo que se infla progresivamente. En la superficie del globo hay puntos marcados que representan las galaxias y cúmulos de galaxias. Podemos trazar una cuadrícula de coordenadas curvilíneas en la superficie del globo, de modo que los puntos que representan a cada una de las galaxias se encuentren en la intersección de dos líneas de coordenadas. A medida que se dilata la membrana elástica que forma la superficie del globo, los puntos se separan, al igual que las líneas de coordenadas, pero sus coordenadas respecto de la red que se dilata no cambian. Imaginemos ahora una población de hormigas en movimiento en la superficie del globo. Su movimiento representa el movimiento de las galaxias respecto de la velocidad local promedio de la materia. Las hormigas poseen una velocidad máxima de desplazamiento respecto de la membrana elástica, de modo que cuando se cruzan dos hormigas en un mismo punto de la superficie del globo, la velocidad relativa de una hormiga respecto de otra no puede superar el doble de esta velocidad límite, estando ambos movimientos referidos a la membrana en expansión. No obstante, si la expansión de la membrana es lo bastante rápida, dos hormigas situadas en puntos diferentes pueden estar separándose más rápido que el doble de la velocidad límite. Esto puede considerarse como una analogía con lo que ocurre en el Universo (considerado como un tiempo-espacio-materia en expansión), con las galaxias moviéndose con velocidades que no superan a la velocidad de la luz respecto del marco de referencia local. El corrimiento al rojo del espectro de las galaxias junto con la Ley de Hubble, el comportamiento del brillo superficial 202 y la magnitud aparente de las galaxias distantes, junto con la radiación electromagnética considerada fósil, prácticamente isótropa, actualmente de cuerpo negro frío (con temperatura cercana a 3 o K), se toman como evidencia de una expansión producida en grandes rasgos en forma acorde con el modelo estándar A-CDM de Universo. 202 El brillo superficial es flujo de energía proveniente de la galaxia, computado por unidad de ángulo sólido y por unidad de área donde se encuentra el observador. La magnitud aparente es una función del brillo superficial y tamaño angular aparente de la galaxia. 241

242 Si se admite que el Universo puede haber tenido un comienzo, es concebible que ese comienzo haya sido una explosión gigantesca, conocida como Big Bang, a partir de lo que se conoce como una singularidad. Durante los tres minutos siguientes a la gran explosión, se estima que nació la materia tal como la conocemos, en un proceso que se denomina núcleo-síntesis primordial. El proceso de núcleo-síntesis fue propuesto por Gamow en 1942 y desarrollado por Alpher, Gamow y Herman a comienzos de la década de En 1948, R. Alpher y R. Herman predijeron la existencia de una radiación de fondo de microondas asociada al Big Bang, que fue detectada recién en Se supone que el Universo consistía al principio de una mezcla de corpúsculos de materia y antimateria cuya densidad y temperatura eran extraordinarias, en rápida expansión. Para impedir la aniquilación completa de la materia por la antimateria en una etapa posterior, más fría, parece razonable asumir, como lo hizo Gamow, que había un ligero exceso de materia respecto de la antimateria 204 Los neutrinos se desacoplan del resto de la materia (el desacople se produce porque el intervalo de tiempo entre dos interacciones es mayor que la edad del Universo). Los nucleones reaccionan parcialmente con los anti-nucleones por aniquilación recíproca y a medida que la expansión continúa la temperatura desciende. Los nucleones remanentes pueden comenzar a formar núcleos de helio y más pesados. Los positrones reaccionan parcialmente con los electrones, mientras que los fotones resultantes de la aniquilación de materia con antimateria comienzan a interactuar mayoritariamente con los electrones remanentes. Las interacciones son ahora tan frecuentes que los fotones no se pueden propagar libremente y del intercambio de energía resulta un Universo cerca del equilibrio térmico: se forma un cuerpo aproximadamente negro. Como vimos en , se suele aceptar que se puede realizar una descripción aproximada de las características a gran escala del Universo poniendo = 0 en la primera ecuación de Friedmann-Lemaítre. A partir de la simplificación introducida en , relacionado las densidades de materia-energía en cualquier instante inicial t 0 con sus valores en cualquier instante t a través del factor de escala, la dinámica viene entonces gobernada por la ecuación aproximada: 1 dr (t) >(t) dt y 8n G 3 Pm (t 0 ),(-C ) r (tp) 1 V r 0 (t) + Pr (t0 ) V r 0 ( t ). Esta ecuación se puede integrar expresando el tiempo cósmico en función del radio de curvatura del tiempo -espacio-materia y de los parámetros de densidad introducidos en : + P. 203 R. Alpher "Una visión retrospectiva del modelo cosmológico del Big Bang" en J. Gonzalo, J. Sánchez y M. Alario (Eds.) "Cosmología astrofísica", Alianza, Madrid, Una interpretación alternativa puede hallarse en H. Alvén "Cosmology in the plasma Universe", IEEE Transactions on Plasma Science, volumen 18, 1990, pp

243 í \ 1 r0 f dx TT 8n - G 7\ t(r 0 ) = HH~' l l í \ í \ 3 / H 0 0 X ^Q A (t 0 ) + Q m (t0 )-X -3 r (t0 )' X * H 0 = a " " 3 3 P c Si se pone r 0 = r 0 (t 0 ) se obtiene una fórmula que se puede utilizar para calcular la edad actual t 0 del Universo. Si se desprecia el aporte del término asociado a (t 0 ) (t 0 ), se obtiene un modelo más simple (modelo A-CDM), con materia oscura fría y energía oscura dominante. La introducción de la materia y la energía oscuras plantea varios problemas relacionados con la teoría cuántica de campos y la física de partículas elementales. De momento no hay una explicación física satisfactoria para la energía oscura. La materia oscura parece implicar la presencia de un tipo de partícula, reliquia de una etapa temprana de evolución del Universo, que todavía no ha sido detectada. Por otro lado, no sabemos bien cómo serían las leyes físicas que se le podrían aplicar al estado de la materia en el comienzo mismo del Universo. Pero, no disponiendo de una alternativa mejor, podemos suponer que a partir de algún instante posterior al inicio del tiempo cósmico y a la denominada fase de inflación (que se considera más adelante), posiblemente desde algunos segundos a partir del Big Bang hasta la actualidad, se aplica este modelo matemático A-CDM. Dado que al principio cabe esperar que el término correspondiente a la radiación haya sido enorme en comparación con los otros que aparecen en la cantidad sub-radical, la dinámica habría sido controlada por la radiación. Como la densidad de radiación, proporcional a ' r (t0) v debería ser al comienzo V r '0*(t) enorme, si admitimos que la ley de Stefan según la cual la densidad total de radiación es proporcional a T 4, se aplica a esa radiación primigenia, entonces la temperatura T(t) debería variar como r 0 ( t ) y ser extremadamente elevada. Una vez que la expansión avanza lo suficiente, la radiación deja de dominar la dinámica, dando paso a un dominio de la materia primero y de la energía oscura después. Cuando la radiación y la materia dominan la expansión, esta es desacelerada. Pero cuando comienza a dominar la energía oscura, la expansión se acelera. Una vez transcurridos unos centenares de miles de años de tiempo cósmico, acompañando el descenso en la temperatura, los electrones se enlazan a los núcleos atómicos y los átomos comienzan a formarse. Las interacciones de los fotones se hacen mucho menos frecuentes, por lo cual se desacoplan y forman el fondo de radiación fósil isótropo y al parecer homogéneo, detectado por primera vez por en 1964 por Arno Penzias y Robert Wilson. Este hallazgo fue interpretado como una confirmación de la etapa de evolución del Universo que en el modelo de Alpher, Gamow y Herman se denominaba bola de fuego En el modelo cosmológico de Alpher, Gamow y Herman, el inicio de la expansión y la aparición de la bola de fuego prácticamente coinciden. 243

244 Posteriormente, nuevas observaciones y desarrollos teóricos condujeron a pensar que el origen de la radiación fósil debe hallarse en un gran destello originado en una emisión explosiva a partir de una generación precoz de estrellas hace unos 10c 10 9 años, es decir unos 10c 10 6 años contados a partir del inicio de la expansión del Universo 206. Se supone que los elementos más pesados que el helio se sintetizaron en estas estrellas tempranas, antes de que se formaran las galaxias. Durante su fase de emisión explosiva, las estrellas precoces expulsaron gases que posteriormente se condensaron formando polvo cósmico. El polvo cósmico, interactuando con los fotones, contribuyó a aproximarlos al equilibrio térmico (radiación de cuerpo negro). Luego la opacidad del universo habría desaparecido, los fotones se habrían podido propagar libremente y se habrían desacoplado lo suficiente de las partículas materiales como para que las características del espectro de radiación se mantuvieran de ahí en adelante, con una salvedad, que la temperatura de la radiación se fue modificando como consecuencia de la expansión del Universo. La explicación del corrimiento al rojo de origen cosmológico, presentada en y basada en el modelo cosmológico estándar, junto con consideraciones de termodinámica estadística permite describir la relación entre la temperatura de esta radiación de fondo y el factor de escala del Universo en cada instante de tiempo cósmico. Admitiendo que la expansión del Universo produce un enfriamiento adiabático 207 de la radiación de cuerpo negro, cabría esperar que una consecuencia de la homogeneidad y la isotropía del cosmos sea que el número relativo de fotones de frecuencia f por unidad de volumen n(^,t^ (donde n(f,t) es la densidad de fotones correspondiente a n( /0. T ) una frecuencia f y f 0 es una frecuencia de referencia) se haya mantenido relativamente invariante, pero que la temperatura característica T(t) de esta distribución haya venido disminuyendo conforme el radio de curvatura del Universo aumenta 208 : T (t 2 ) r 0 (t 2 ) = T (t x ) r 0 (t,) Actualmente el fondo de radiación electromagnética fósil, prácticamente homogénea e isótropa presenta una temperatura extremadamente baja: 2.73o K. En relación con la gran explosión y la subsecuente expansión del Universo, la homogeneidad e isotropía de la radiación de fondo medida por instrumentos a bordo del satélite COBE a partir de 1991, plantea un problema relacionado con la causalidad. 206 Esta estimación del momento del destello se basa en asumir un corrimiento al rojo de 100, en la A r (t ) 3 relación 1 + C = = 0 / r \ deducida en y en la relación r 0 ( t t 3 correspondiente a un A f r 0 (t f ) Universo dominado por la materia considerado en R. Tolman "Relativity, thermodynamics and cosmology', Clarendon Press, Oxford, Una demostración cuidadosa puede encontrarse en E. Peebles "The large structure of the Universe', Princeton University Press, Princeton,

245 Para ver esto es preciso reconsiderar el horizonte de eventos de un suceso, es decir, los eventos más lejanos (y por ende más distantes hacia el pasado) que pueden influir sobre el suceso en cuestión. En el momento en que las partículas de materia y la radiación se desacoplaron, este horizonte tenía una extensión (para los eventos de aquel entonces) muy reducida en comparación con la que tiene para los eventos presentes: apenas algunos grados de distancia medidos en la bóveda celeste. No obstante, la radiación fósil es como una fotografía transmitida hasta el presente de lo que ocurrió en aquel momento tan lejano en el tiempo, y muestra una sorprendente uniformidad que sugiere que las fuentes de la radiación se comportaron de manera igual aunque sus horizontes de eventos en ese momento no les permitiera interactuar intercambiando información. Una posible explicación es el modelo de inflación de Guth 209. Guth conjeturó que en los primeros instantes de vida del Universo la densidad estaba dominada por un campo global, el inflatón, que se asocia a una dilatación súbita tiempo-espacio-energía (a la cual que denominó inflación), en un factor de La duración del proceso inflacionario es incierta, pero debe haber sido muy breve. (Figura 12.4) Figura 12.4 Representación de las etapas de evolución del Universo de acuerdo con el modelo estándar, incluyendo la fase inflacionaria inicial. El espacio cósmico aparece, para cada instante de tiempo cósmico, como una circunferencia ortogonal al eje del tiempo. Al comienzo la expansión presenta una enorme aceleración asociada al proceso de inflación. Luego se desacelera hasta que, más cerca del presente, la expansión del Universo comienza a acelerarse nuevamente. En principio, la inflación podría explicar parcialmente algunas características del Universo que el modelo original del Big Bang no puede explicar y debe tener en cuenta bajo la forma de postulados: el elevado grado de aproximación a una geometría plana 209 E. Harrison "Cosmology: the science of the Universe", Cambridge University Press, Londres, J. Rich "Fundamentals of Cosmology", Springer Verlag, Heildelberg,

246 que parece presentar el espacio físico (las hiper-superficies espacialoides del flujo de Hubble), porqué el Universo parece ser homogéneo e isótropo a gran escala pero heterogéneo a escalas menores. Se supone que cuando la temperatura descendió lo suficiente la influencia del inflatón se desvaneció y comenzó la expansión propiamente dicha, dominada al principio por la radiación. Una vez que la dinámica del Universo pasa de ser gobernada por la radiación a ser gobernada por la materia, se habrían formado las galaxias y continuado la expansión. Se supone que al salir de la etapa de inflación la materia presentaba fluctuaciones microscópicas de densidad: los gérmenes de las futuras galaxias. Cabría esperar que esas fluctuaciones se traducirían en fluctuaciones, pequeñas pero observables, en el fondo de radiación fósil. A partir de 1992 se pudo detectar una anisotropía muy pequeña pero significativa 210 en la intensidad de la radiación proveniente de diferentes direcciones que incidía sobre el satélite COBE. Se interpreta como evidencia experimental de la formación de los gérmenes de las actuales galaxias Modelo de Universo en mosaico. Los modelos basados en la métrica estándar no permiten tener en cuenta la estructura discreta que se observa en pequeña escala. Esta estructura se caracteriza por conjuntos de astros con interacción gravitatoria mutua significativamente más fuerte que la interacción que los astros del conjunto presentan con conjuntos más lejanos. En la medida en que esto ocurre a cada uno de estos conjuntos se le puede denominar sistema auto-gravitante. Un modelo un poco más realista, muy simple pero que tiene en cuenta la estructura heterogénea formada por los sistemas auto-gravitantes, es el modelo de mosaico. Consideremos un caso en el cual la densidad de masa es uniforme, excepto en una pequeña región esférica cuyo radio es proporcional al factor de escala r 0 (t) y supongamos que la totalidad de la masa necesaria para que esta región posea la misma densidad que el resto del Universo se encuentra concentrada en el centro de la esfera. El resto forma una cavidad hueca. Ahora bien, el campo gravitatorio fuera de la cavidad es el mismo que se hallaría si la masa puntual se encontrara uniformemente distribuida. Como consecuencia la presencia de la cavidad no modifica la dinámica global del modelo de Universo: se expande igual que si la cavidad no existiera. Pero además, el resto del Universo no incide sobre el campo gravitatorio en el interior de la cavidad. Este último viene dado por la métrica de Schwarzschild, como si la masa puntual que ocupa el centro de la cavidad se encontrara en el espacio vacío. No obstante, en la frontera de la cavidad las estructuras de tiempo-espacio asociadas a las dos métricas deben coincidir. Como el resto del Universo no rota localmente, la masa puntual tampoco debe rotar. Es posible sustituir la masa puntual por un sistema auto-gravitante lo bastante pequeño. No es necesario suponer que la distribución de la densidad en el exterior de la esfera sea 210 Empleando un instrumento conocido como radiómetro diferencial de microondas, se midieron fluctuaciones en la radiación con valores (relativos al valor promedio) del orden de

247 exactamente uniforme, lo cual nos permite contemplar la presencia de otros agrupamientos de astros análogos al que ocupa la parte central de la esfera. La única condición que debe cumplirse es la coincidencia de las estructuras de tiempo-espacio en las fronteras. Como los efectos gravitatorios de los agrupamientos de astros no se extienden mucho más allá de distancias del mismo orden numérico que la dimensión de esos agrupamientos, la dinámica del Universo en sí mismo, su estructura de tiempo y espacio en gran escala, es el resultado de su contenido de materia (partículas y radiación), pero no influye directamente en la dinámica en pequeña escala de los sistemas autogravitantes, incluidas las galaxias. Suministra un conjunto de marcos de referencia locales que no se encuentran acelerados respecto del marco de referencia cósmico. Este modelo plantea un Universo en mosaico, en el cual los agrupamientos locales distorsionan débilmente la estructura del tiempo-espacio, de modo que se puede aplicar localmente el tipo de aproximación utilizada en el estudio de las lentes gravitacionales o del corrimiento al rojo de la luz en los campos gravitatorios considerados en 11.6 y 11.3, respectivamente. 247

248 13. La metagalaxia "Al aumentar la distancia, nuestro conocimiento se desvanece, y se desvanece rápidamente. Eventualmente, alcanzamos las dimensiones fronterizas-los límites de los telescopios. Allí medimos sombras, y buscamos entre errores fantasmales de medida, señales que son apenas más sustanciales que estos errores " Edwin Hubble, "The realm of the nebulae", Yale University Press, New Haven, 1936, p "Nosotros no somos más que polvo de estrellas, cada elemento que nos compone contiene carbono, oxígeno y otros elementos que han sido todos, un día, sintetizados en una estrella, que muriendo en mil fuegos, esparció la simiente necesaria para nuestra existencia " Hubert Reeves, en "Poussieres d'étoiles", Seuil, Paris, "Chandrasekhar muestra que una estrella cuya masa supera un cierto límite permanece como un gas perfecto y no puede enfriarse hasta el equilibrio. La estrella tiene que continuar radiando y radiando y contrayéndose y contrayéndose hasta que, supongo, alcanza un radio de unos pocos kilómetros cuando la gravedad se hace lo bastante intensa como para retener la radiación y la estrella puede al fin hallar la paz. Me siento impelido a concluir que esto es casi una reducción al absurdo de la fórmula de degeneración relativista. Varios accidentes pueden intervenir para salvar la estrella, pero yo quiero más protección que esa. Pienso que debería haber una ley de la naturaleza que impida a la estrella comportarse de esta manera absurda ". Arthur Eddington comentando un trabajo de su alumno Subrahmanyan Chandresakhar, presentado en enero de 1935 en una reunión anual de la Royal Astronomical Society. "Cuando discutimos las variadas posibilidades que aparecen como resultado de las interacciones con agujeros negros o entre agujeros negros, estamos hoy día considerando seriamente situaciones que hace no mucho tiempo fueron barridas hacia un costado como reducciones al absurdo. Por mi parte, mientras considero los fenómenos asociados con los horizontes de eventos y la imposibilidad de comunicación a través de ellos, a menudo recuerdo una parábola sobre la naturaleza que aprendí hace cincuenta años en la India. La parábola se refiere a larvas de libélula depositadas en el fondo de un estanque. Una fuente constante de misterio para esas larvas es lo que ocurre, una vez alcanzado el estadio de crisálida, cuando pasan a través de la superficie del estanque para no regresar jamás. Cada larva, cuando se acerca el momento en el que se transformará en crisálida, promete regresar y contar a las que permanecieron en el estanque lo que realmente ocurre más allá, negando o confirmando un rumor, atribuido a una rana, según el cual cuando una larva emerge de la superficie del estanque, al otro lado de su mundo, deviene una criatura maravillosa, con un cuerpo largo y delgado y alas iridiscentes. Pero cuando emerge del estanque como libélula completamente formada, resulta incapaz de retornar, de penetrar la superficie del agua, pese a todos sus esfuerzos y por más tiempo que dedique. 248

249 Así, los libros de historia de las larvas no registran regreso alguno para contar lo que les ocurre al atravesar el domo de su mundo. Y la parábola finaliza con una súplica: Ninguno de ustedes, por piedad, a aquellos dejados atrás, les develará el secreto? " Subrahmanyan Chandresakhar, en una conferencia sobre el rol creciente de la teoría generalizada de la relatividad en las investigaciones astronómicas y astrofísicas, en la Universidad de Oxford, en mayo de La cita de Hubble al comienzo de este capítulo llama la atención sobre un aspecto importante relacionado con las incertidumbres en las mediciones astronómicas y astrofísicas. Pese a los notables progresos en la instrumentación y pese a las posibilidades que brinda la astronáutica, a través de las nuevas plataformas de observación (las sondas espaciales) disponibles para instalar y operar los instrumentos significativamente mejorados, la dificultad de fondo que señala Hubble permanece cuando el interés de los estudiosos no se limita ya a una región relativamente acotada, como el Sistema Solar, sino abarca la totalidad del cosmos. Cuando se trata de elegir entre modelos cosmológicos sobre la base de evidencia empírica, aparece un escollo fundamental: la inmensa duración del intervalo de tiempo que al parecer se requiere para acumular datos en calidad y cantidad adecuada para someter a teorías, a menudo antagónicas, a la necesaria confrontación con la experiencia. Entonces, si no se abandona el intento, se corre el riesgo de recurrir a razones de índole religiosa, filosófica, e inclusive estética. La cita de Eddington, opinando sobre el trabajo de Chandrasekhar, es bastante elocuente al respecto. Todo lo que podemos observar desde la Tierra, es una esfera (formada por líneas geodésicas que parten desde el observador) de un radio aproximado de 46c 10 9 años-luz. Se estima que en ese universo observable, denominado Metagalaxia, hay galaxias. El diámetro de nuestra galaxia es de solo 1c 10$ años-luz. Una distancia común entre galaxias próximas es 3 c 10 6 años-luz. Habría un número de estrellas del orden de en la Metagalaxia. A escalas cuyos órdenes de magnitud son inferiores a 300c 10 6 años-luz se tiene evidencia de una estructura jerárquica. La mayor parte de los átomos y de la radiación forman estrellas, aproximadamente esféricas y en equilibrio fluido-dinámico. La mayor parte de las estrellas forman galaxias y las galaxias forman cúmulos de galaxias. Los cúmulos se incorporan en súper-cúmulos y éstos en grandes estructuras, hasta la escala en la que se asume homogeneidad e isotropía y se aplica el principio cosmológico. La densidad promedio se estima en 9.9c gramos por centímetro cúbico, con un 74% de energía oscura, un 22% de materia oscura fría y un 4% de materia ordinaria. En promedio habría el equivalente en masa a un átomo de hidrógeno cada 4 metros cúbicos. No parece haber carga eléctrica neta a escala cosmológica, lo que hace que la gravitación domine la dinámica a gran escala. Las estrellas nacen, evolucionan y mueren. La energía que irradian procede de reacciones de fusión de los núcleos atómicos del material del interior estelar, a temperaturas de millones o decenas de millones de grados. Aproximadamente nueve décimas partes de la masa de ese material es hidrógeno y helio. Los elementos más pesados, que se encuentran en distintas partes de la Metagalaxia, y en particular en nuestro rincón, en la Tierra y la Luna, se formaron en las entrañas de las estrellas. 249

250 Se plantea entonces el problema de la génesis, evolución y transformación de la materia para formar las estrellas y las galaxias Modelos de Metagalaxia El carácter irregular, más bien de tipo fractal, (en cúmulos, super-cúmulos, super-supercúmulos,...de galaxias) que presenta la distribución de la materia a escalas relativamente pequeñas puede tenerse en cuenta mediante un principio cosmológico estadístico 211 : la distribución de materia sigue las mismas leyes estadísticas con independencia del marco de referencia empleado para la observación. Si no se establece un corte a una escala lo suficientemente grande, se obtienen sistemas cuyas masas y diámetros superan cualquier límite pre-establecido y cuyas densidades se hacen cada vez menores, tendiendo a cero: este es el modelo de Universo estacionario que C. Charlier propuso en Algunas personas consideran inadecuado el uso de modelos cosmológicos que describen partes de un Universo que no es ni será observable. Por este motivo prefieren modelar la Metagalaxia, considerado como un sistema de galaxias auto-gravitante máximo. En general admiten que hay una escala máxima para la distribución cuasi-fractal de la materia, y que a escalas mayores se puede recurrir a modelar la Metagalaxia asumiendo homogeneidad e isotropía en promedio: se aplica entonces el mismo principio cosmológico utilizado en los modelos de Universo. Lo más simple que puede hacerse en este caso es partir de un modelo como, por ejemplo, el hiperbólico o el plano, agregando una frontera en la coordenada radial. En ese caso el volumen V Meta (t) y la masa M Meta están acotados, mientras que en el modelo original de Universo hiperbólico o plano el volumen es ciertamente infinito. Si suponemos un modelo de Metagalaxia hiperbólico caracterizado porque la coordenada radial está acotada r < r F, el volumen se puede hallar mediante la fórmula presentada en al final de la parte sobre el modelo hiperbólico. Si se supone un modelo plano, el volumen es el de una esfera de radio r F. En ambos casos r F se expande en forma proporcional al factor de escala cósmico. Si P Meta (t) es la densidad promedio, la masa M Meta de la Metagalaxia se puede estimar mediante la fórmulam Me ta = PMeta (t) ' V (t) Meta Si bien el modelo hiperbólico no acotado y el modelo hiperbólico acotado no difieren en sus predicciones en la medida en que nos mantengamos lejos del borde del modelo acotado y no retrocedamos mucho hacia el pasado, la diferencia puede ser significativa cuando estas condiciones no se verifican 212. Suponiendo que el volumen V Meta (t) es proporcional al cubo de un radio característico R Meta (t), y que en ningún momento de la evolución de la Metagalaxia ese radio puede haber sido inferior al radio de Schwarzschild correspondiente a la masa de 211 B. Mandelbrot "La geometría fractálica de la naturaleza", Taurus, Madrid, Varias consideraciones sobre el modelo hiperbólico de Metagalaxia, basadas en la evidencia disponible en aquel entonces, pueden hallarse en O. Klein "Arguments concerning relativity and cosmology", Science, vol. 171, 1971, pp

251 2 G M la Metagalaxiar SMeta = 2 Meta, de esta última condición y de la relación c M Meta = PMeta (t) V Meta (t) ~ pmeta (t) ^ R Meta (t) se des p rende un límite su p erior ara la p densidad p romedio: pmeta Por ejemplo, si M Meta fuera / \ 3 c 6 (t) ^ ^ ^ 3 2 n ^ G M Meta del orden de g, entonces el límite de densidad sería del orden de los g/cm 3. En el estadio llamado de la bola de fuego, la densidad promedio del Universo primitivo se supone tomaba valores del orden de 10 4 g/cm 3, claramente incompatible con las hipótesis de una masa constante y de dimensiones acotadas inferiormente por un radio de Schwarzschild. Este tipo de consideración, junto con argumentos de simetría en relación con la proporción de materia y antimateria, condujeron a O. Klein y a su alumno H. Alfvén a desarrollar un modelo de nube primordial de materia (protones) y antimateria (antiprotones) en partes iguales, el ambiplasma, extremadamente tenue, que se habría contraído por efecto del campo gravitatorio. Las leyes de la magneto-hidrodinámica resultan fundamentales para comprender lo que acontece según este modelo 213. El modelo cosmológico plano sirvió de base para una explicación de la formación de las galaxias, conocida como hipótesis de acumulación gravitatoria 214, alternativa a la hipótesis de la bola de fuego. La hipótesis de la acumulación gravitatoria originó una teoría que da cuenta de la estructura jerárquica de las agrupaciones estelares. Permite explicar la naturaleza fractal de esta estructura hasta alcanzar una dimensión de corte de aproximadamente 300c 10 6 años-luz. Resulta interesante que al haber introducido una acotación en la coordenada radial del modelo hiperbólico o en la del modelo plano, el marco de espacio que éste suministra queda físicamente limitado, pero esta limitación no se corresponde con un límite propio del modelo matemático, puesto que ni el modelo hiperbólico ni el modelo plano lo tienen. Esto constituye una diferencia muy significativa respecto del modelo esférico Estrellas Una estrella es un cuerpo formado por un gigantesco conglomerado gaseoso de partículas y radiación, confinado por su propio campo gravitatorio, que equilibra el efecto disgregante de la presión de las partículas del gas y de la presión de la radiación. En forma algo sobre-simplificada puede decirse que una estrella nace cuando una masa lo bastante grande de gas compuesto por una mezcla en las que el hidrógeno y el helio 213 Una buena descripción de estas ideas de Klein y Alfvén se puede hallar en el artículo de H. Alfvén "Antimatter and cosmology", Scientific American, abril de Una exposición muy clara del mecanismo de acumulación gravitatoria y de la evidencia empírica que motivó la introducción de la hipótesis de una generación de estrellas pre-galácticas y el gran destello que les puso fin, realizada por la persona que propuso ese mecanismo ya en 1951, se puede encontrar en D. Layzer "Construcción del Universo', Labor, Barcelona,

252 son mayoritarios 215, se contrae bajo la acción de la gravedad. A medida que la masa se contrae, un núcleo central se calienta y la presión aumenta. Cuando la presión y la temperatura han aumentado lo suficiente, se desencadena un proceso de fusión de núcleos de hidrógeno 216. Las estrellas pueden mantener un estado prácticamente estacionario durante miles de millones de años, liberando energía termonuclear de fusión en su región central (que se encuentra por lo general a temperaturas del orden de los millones o decenas de millones de grados) y radiando la potencia producida hacia el espacio circundante. En el caso del Sol, compuesto de 71% de hidrógeno, 27% de helio, y de pequeños porcentajes de otros elementos (carbono, nitrógeno, oxígeno, neón, magnesio, silicio, azufre y hierro), cuatro núcleos de hidrógeno reaccionan en etapas para dar lugar a un núcleo de helio. Como la suma de las masas de reposo de los protones m p es superior a la masa de reposo del núcleo de helio m He, durante ese proceso se libera una energía (4- m p - m He ) c 2, igual a 27 MeV. Esta es la fuente de la energía que el Sol radia a razón de 4c kw. Esta potencia radiada se denomina 1 uminosidad. La masa solar estimada es de 2c kg, el radio solar es de 6.9c 10 5 km y su edad actual se estima en 5 c 10 9 años. En su fase actual, se estima que la luminosidad del Sol debe permanecer prácticamente constante durante miles de millones de años. Cuando se consume el hidrógeno, la estrella se contrae, aumentando la temperatura en su centro hasta alcanzar un valor crítico que hace posible un nuevo tipo de reacción de fusión liberadora de energía: tres núcleos de helio originan un núcleo de carbono y se establece un nuevo estado estacionario. Cuando se consume el helio, la estrella comienza a contraerse de nuevo, aumentando aún más su temperatura interna, hasta alcanzar un nuevo valor crítico que hace posible otra reacción de fusión nuclear exotérmica. Comparando este proceso de fusión nuclear, lenta y estable, con la brusca detonación de las bombas de fusión que conocemos bien aquí en la Tierra, cabe preguntarse a qué se debe la estabilidad de las estrellas. El teorema del virial, visto en 11.6 en relación con la materia oscura cósmica, puede utilizarse para analizar lo que ocurre en una estrella como el Sol, en condiciones en que se pueden despreciar los efectos de la presión de los corpúsculos sobre la energía total de la estrella. Cuando se puede despreciar los efectos de la presión, la energía total de una estrella se puede expresar como suma de la energía cinética E c de las partículas y la energía potencial gravitacional del sistema O: E e = E c + $ El teorema del virial asegura que 2 E c + $ = 0. Supongamos que esta igualdad se mantiene, al menos con buena aproximación, cuando la estrella se aparta ligeramente de su estado estacionario. Entonces, del teorema del virial resulta E e = E c + $ = -E c. 215 El 98 % de la masa de la Vía Láctea está compuesta de hidrógeno y de helio. Los elementos más pesados son producidos por reacciones de fusión nuclear en el interior de las estrellas. 216 Una descripción verbal detallada del nacimiento, evolución y desaparición de las estrellas puede hallarse en el libro de J. Comellas "El mundo de las estrellas", Equipo Sirius, Madrid,

253 3 Pero, por otro lado, E c ~ N^k B (T) donde N es el número de partículas en el gas estelar, k B es la constante de Boltzmann y (T) es la temperatura promedio de la estrella. Si L es la luminosidad y F es la potencia liberada por fusión termonuclear, entonces la velocidad de variación de la energía total de la estrella viene dada por: E e = F - L dt En estado estacionario F = L y como consecuencia E e permanece constante. Supongamos que, debido a una perturbación, F > L Entonces E e > 0 por lo cual dt E e debe aumentar. Pero como E e =-E c, resulta que E c < 0con lo cual E c debe dt disminuir. Si disminuye E c, disminuye (T), y si disminuye (T) esto trae como consecuencia una disminución de F. Esta disminución se mantiene mientras se verifique F > L, así que esta secuencia de procesos tiende a conducir a la estrella a un estado estacionario. Si F < L la energía E e disminuye, E c aumenta al igual que (T), lo que trae como consecuencia un aumento en F que continúa mientras se verifique F < L.La secuencia de procesos tiende nuevamente a conducir a la estrella a un estado estacionario. Así pues, un sistema termonuclear auto-gravitante posee una regulación automática de la velocidad con que se desarrollan las reacciones de fusión en su interior, basada en un calor específico negativo: si su energía aumenta (disminuye) su temperatura disminuye (aumenta) Enanas Mancas Cuando se agotan las posibilidades de nuevas reacciones de fusión exotérmicas, la estrella continúa disipando energía, lo cual disminuye su temperatura. Al disminuir la temperatura la presión del gas no puede impedir el colapso gravitatorio de la estrella. Si esta posee una masa inferior a un valor límite de aproximadamente 1.4 veces la masa del Sol, se contrae hasta formar una especie de átomo gigantesco. Los núcleos han perdido sus electrones (al menos los de los orbitales externos). Los electrones forman un gas al que se aplica el principio de exclusión de Pauli: dos electrones no pueden tener los mismos números cuánticos. Como el número de electrones es enorme, se llenan todos los estados cuánticos desde el de mínima energía hasta estados cuyas energías son considerables. Como consecuencia de este efecto mecánico-cuántico, la agitación y la presión son muy grandes. Aún a bajas temperaturas, cercanas a los 0 o K, la presión del gas de electrones es capaz de detener el colapso gravitatorio, pero lo puede hacer en condiciones en las que las densidades estelares son muy grandes, del orden de 10 8 g/cm 3 y el radio estelar muy pequeño, del orden de los 1000 km La densidad promedio del Sol es de 1.41 g/cm 3 y su radio del orden de los 10 5 km. La densidad promedio de la Tierra o de Venus es de 5.5 g/cm

254 A estos astros se los conoce como enanas Mancas. Son poco luminosas porque tienen poca energía para radiar. Los núcleos atómicos no contribuyen en forma significativa a la presión en el interior de las enanas blancas 218. Cuando se comenzó a investigar el proceso de enfriamiento de las estrellas con las herramientas que suministraba la mecánica cuántica, se construyeron modelos no relativistas de la dinámica electrónica. Se basaban en en una ecuación de estado propuesta por R. Fowler en 1926 para describir la relación entre presión, densidad y temperatura de un gas electrónico. Este enfoque del problema del enfriamiento estelar condujo a predecir una relación entre la masa M del astro y su radio R en el estado de f R Y equilibrio del tipo M = M x I donde M y R son constantes. De acuerdo con V R J esta relación, el radio de la estrella disminuye con el aumento de la masa, pero en principio son posibles estados de equilibrio para todo valor de la masa estelar. Aún las estrellas más masivas podrían enfriarse en forma estable hasta un estado de equilibrio final. Pero los cálculos de las cantidades de movimiento de los electrones en el centro de las estrellas ya enfriadas sugerían que deban tomar valores comparables con m e c, donde m e es la masa del electrón. En estas condiciones la dinámica es relativista, no clásica, de modo que se hizo evidente la necesidad de modificar los modelos de enfriamiento estelar. El trabajo pionero de Chandrasekhar, en 1935, introdujo la dinámica de la relatividad restringida en los modelos de evolución estelar. Los resultados del nuevo modelo sugerían que la evolución de las estrellas de masa pequeña debía ser esencialmente diferente de la evolución de las estrellas muy masivas. Mientras que para una estrella de masa pequeña el estadio de enana blanca parece ser el paso previo a la extinción completa, una estrella masiva no puede pasar sin más al estadio de enana blanca. Es necesario contemplar otras posibilidades. La interpretación de datos experimentales, obtenidos posteriormente, confirma las predicciones de los modelos relativistas, incluyendo un estadio alternativo al de enana blanca: la estrella de neutrones y su manifestación electromagnética, el pulsar. Sin entrar en los detalles del trabajo de Chandrasekhar sobre las enanas blancas y de trabajos posteriores de otros autores sobre las enanas blancas y las estrellas de neutrones, como los de J. Oppenheimer, G. Volkoff y L. Landau entre otros, se pueden construir modelos relativistas muy simple de enanas blancas y de estrellas de neutrones. Tanto para las enanas blancas como para las estrellas de neutrones, el modelo simplificado permite estimar sus radios y predecir la existencia de masas umbral, por encima de la cual el estado de la materia característico de estos estadios de la evolución estelar no es estable. Para construir un modelo relativista de enana blanca, se comienza por una expresión de la energía E m del sistema como suma de un término que tiene en cuenta la combinación de la energía cinética con la energía de reposo para los electrones y un término que tiene en cuenta la energía potencial debida a la interacción gravitatoria entre los núcleos que forman el sistema. Se desprecia el aporte de la agitación de los núcleos y la energía 218 Las propiedades de la materia a densidades elevadas pueden estudiarse en el capítulo 11 del libro de L. Landau y E. Lifchitz "Física estadística", Reverté, Barcelona,

255 potencial debida a la interacción electroestática entre las cargas, asumiendo que los términos de repulsión equilibran a los términos de atracción en el interior del plasma estelar, debido a que carga neta es nula y los núcleos atómicos y los electrones se encuentran íntimamente entremezclados. Consideremos un sistema formado por N átomos de número atómico Z y número de masa A, completamente ionizados. Teniendo en cuenta que, como se mostró al final de 7.1, la energía E de una partícula con cantidad de de movimiento p y masa en reposo m 0 se puede expresar mediante la fórmula E = ^m 0 2 c# + c 2 p 2, el término debido a la energía de los electrones se puede expresar mediante N Z ^m 2 e c# + c 2 p 2. En esta expresión m e es la masa en reposo del electrón y p es una cantidad de movimiento promedio. El término de interacción gravitatoria entre los núcleos se puede estimar mediante la expresión - N 2 -G - (A Mn ). En esta expresión M n es la masa en reposo del 2 R nucleón, sin distinguir a estos efectos protones de neutrones, y R es el radio del sistema, sistema que por simetría se asume adopta una forma esférica. I 2 # (A^M ) 2 Entonces la energía total es: E e = N Z ^m; c# + c 2 p 2 N 2 G 2 R En esta fórmula A^ M n representa la masa de los núcleos atómicos. Si el sistema posee un radio R su volumen es proporcional a R 3. Como a los electrones se les aplica el principio de exclusión de Pauli, podemos suponer que a cada uno le R 3 corresponde un volumen proporcional a. Entonces, combinando esta estimación con el principio de incertidumbre de Heisenberg para el par de variables conjugadas posición y cantidad de movimiento se obtiene 219 : (NZ R - p ~ h )3 1 c p Introduciendo ~ en la fórmula para la energía, dividiendo por el R h c (NZ) 3 número total de electrones y reordenado se obtiene la siguiente fórmula para la energía 2 E a : : r N \ 3 total electrón: e e (p) = = ^m 2 e c# + c 2 p 2 N Z N X V N cr J r Z 2 ^ r 2 ^ G 2 2 G^ M 2 Aquí por definición se ha puesto N cr = N 0 con N 3 0 y a G = r V A J V a G J c h El número sin dimensiones a G ~ 6.3 x gravitatoria. El cálculo de N 0 = da 6c V a G J 3 c p se conoce como constante de interacción 219 Como es usual, h representa el cociente entre la constante de Planck h y 2n. 255

256 Asumimos que el estado que adopta el sistema es el que minimiza la energía e e (p) como función de p (y por ende, minimiza la energía total E m, puesto que el número total de núcleos N viene dado y no varía). d 2 d Puesto que -e 2 (p) > 0 para todo p, el mínimo se presenta cuando e 2 (p) = 0. dp dp Resolviendo esta última ecuación se obtiene que c p ( N ^! I " y m e c + c p V N cr J Como el miembro de la izquierda de esta igualdad es inferior a 1, se desprende que existe una solución siempre que el número total de átomos de la estrella no supere el ( W 2 ^ valor crítico N cr = N 0 A 3. Cuando N se aproxima a su valor crítico, p se hace V A J mucho mayor que m e c.en este caso se dice que los electrones son ultra-relativistas. En forma equivalente, el sistema puede estabilizarse como enana blanca siempre que la masa estelar M ~ N (A M n ) no supere el valor umbral: M ch ~ N cr ( A Mn ) = M o (W J Esta es la denominada masa de Chadrasekhar. Z ComoM se estima en kg, o sea unas 5 veces la masa del Sol, cuando ~ 0 5 A 2 resulta M ch ~ 0.25 M 0 o sea 1.25 veces la masa del Sol. Para una esfera de hierro se obtienem ch ~ M 0, o sea 1.2 veces la masa solar. El modelo más exacto, debido V 5- J a Chandrasekhar, da para una esfera de plasma formada a partir de átomos de hierro un valor umbral de 1.44 veces la masa solar. A partir de la ecuación para el mínimo de energía se puede hallar: ( N ^ 3 m c 2 VN c p = V cr J _. h c (N Z)3 Esto a su vez junto con R ~ que se 4 c p 3 - I N \ 1 V N cr J obtiene de los principios de Heisenberg y Pauli combinados, permite deducir una ecuación para el radio del sistema en función de su masa M : R 2 h 3 M 0 3 I 2 \ ( Z J me c V a G M J l A J Í ( M ^3 V M c h J M Ch = M 0 ^ l A 5 1,..,, ( Z ^ 3 (masasolar\3 Si N es pequeño respecto de N, entonces, en km: R ~ I \ I \ V A J V M J Z 1 Cuando M es igual a la masa solar y ~, resulta un radio de km. A

257 Además, se obtiene para la energía de la enana blanca:, mm ( p ) = m Conviene escribir en este caso N r r 2 ^ V a G J 3 ^ 2 '2 A V A j N N r R N ^ V 'cr j siendo a G = G_Ml c - h un numero V a G J J sin dimensiones que involucra la masa en reposo del neutrón y las tres constantes universales c, h y G. Si una enana blanca cuya masa es inferior al valor crítico M ch incorpora una masa adicional tal que la masa resultante se aproxima al valor dem ch, las reacciones nucleares de fusión se reanudan en el centro de la estrella y se puede producir una explosión termonuclear gigantesca (del orden de los Julios) capaz de destruir la enana y expulsar violentamente el material estelar hacia el espacio. Esta catástrofe se conoce como una Supernova Tipo I Estrellas de neutrones Cuando la masa de la estrella es mayor quem ch, la presión debida a los electrones no es suficiente para frenar el colapso gravitacional. ContinUa la contracción hasta que se hace energéticamente favorable la reacción de captura de un electrón por un protón para producir un neutrón y un neutrino. Entonces desaparecen los electrones y protones, siendo sustituidos por neutrones. Los neutrinos son radiados al espacio exterior. Si la masa inicial no es mucho mayor que el límite de Chandrasekhar, el sistema se estabiliza para masa del orden de los 10 o g/cm 3, y un radio del orden de los 10 km. El campo gravitatorio confina los neutrones a distancias mutuas del orden de las dimensiones nucleares. Se conocen como estrellas de neutrones y se comportan como si fueran un Unico nucleo gigantesco. Unos pocos centímetros cubicos de una estrella de neutrones pesan lo mismo que el resultado de sumar la totalidad de los pesos de los habitantes de nuestro planeta en la actualidad. Es posible construir un modelo matemático relativista, muy simplificado, para una estrella de neutrones, análogo al modelo construido para las enanas blancas. Supongamos que la estrella está formada por N neutrones de masa en reposo M n, y que la energía del sistema se puede reducir a un término asociado con la agitación neutrónica y un término debido a la interacción gravitatoria entre los neutrones: E e = N-^Ml-c 44 + c 2 -p 2 1-N 2 - G - ^ 2 E Como las partículas no tienen carga eléctrica, el término electroestático es nulo. La energía por neutrón se puede poner de la forma: ^ (^ ) = f = 4Mn2 -c 4 + c 2 - p N- ^ G -h- c 2 E 3 257

258 La combinación de los principios de incertidumbre y de exclusión se escribe ahora así: R (N )3 - p ~ h Despejando el radio del sistema e introduciéndolo en la fórmula para la energía por neutrón se obtiene: (p ) = VMn 2 c 4 + c ^ p 2 ( N ^ 3 V N 0 J c p Esta función presenta un mínimo cuando: c p VM 2 c 4 + c^p 2 ( N_ ^ 3 V N 0 J f O M En esta fórmula N 0 = igual que en el modelo de enana blanca. Vale 6c V a G J Para que la estrella de neutrones pueda estar en un estado estable, el número de neutrones debe ser inferior a 6c En ese caso: c p M-c 2 ( N ^ 3 V N0 J N_ 4 V N 0 J Si se introduce la suma de las masas en reposo de los neutrones M 0 = M n *N 0, la energía del estado estable se puede estimar entonces mediante la fórmula: E,mm =(M 0 c 2 ) N - y ( N ^ 3 V N 0 J ( 2 ^ 3 N0 = V a a J a 5 5 Mn Al número crítico de neutrones le corresponde una masa crítica M 0 = N 0 M n c h que la estrella no puede superar para poder adoptar un estado estable. Como vimos en el modelo de enana blanca, M 0 se estima en kg, o sea unas 5 veces la masa del Sol. El radio de la estrella de neutrones se puede estimar mediante la fórmula: R ~ h^ (N) 1 N! 0 V M h n ^ J ( N, 0_ N ( N ^ 3 1 ( h ^ 3 El radio característico R 0 ~ N 0 es de unos 4 km. V M n^ J La masa de la estrella de neutrones se puede estimar mediante la fórmula relativista: =M. 4 N N0 v N 4 > 3 V N0 J 3 V N 0 J 4 258

259 N En función de la masa de una estrella de neutrones presenta un máximo igual a, N o N! aproximadamente, 2.2 veces la masa del Sol, cuando= $. En este caso el radio vale aproximadamente 3 km. Cuando una estrella evoluciona en forma regular y da origen a una estrella de neutrones, se contrae desde un radio del orden de los 10 5 km hasta un radio del orden de los 10 km. Cabe esperar que el momento angular L «I a se conserve durante el proceso 220. Como el momento de inercia I de la distribución de masa en torno al eje de rotación disminuye proporcionalmente a R 2 siendo R el radio de la masa en rotación, la velocidad angular a de rotación de la estrella debe aumentar en consecuencia. Si R 0 y a 0 representan, respectivamente, el radio y la velocidad angular de la estrella joven, mientras que R en y a en representan las correspondientes variable para el estadio de estrella de neutrones, de la conservación del momento angular se desprende: R 0 2 a 0 ^ R en 2 a en En la periferia de una estrella de neutrones se supone que existe una corteza de centenares de metros formada por nucleones inmersos en una masa de electrones. Las elevadas velocidades de rotación generan una estructura de campo magnético dipolar cuyo eje en general no coincide con el eje de rotación. Se supone también que la corteza eléctricamente cargada de la estrella se encuentra rodeada de una delgada fotósfera (con espesores del orden de los decímetros) que se continúa hacia el espacio exterior por una poderosa magnetósfera cuyo espesor es del orden de los 1000 km. Desde los polos magnéticos se emiten rayos X y rayos gamma, mientras que desde la magnetósfera se emiten ondas de radio. Un observador puede medir las emisiones cuando uno de los polos magnéticos se encuentra ente el observador y el eje de rotación de la estrella: en consecuencia la detección de las emisiones es periódica, con períodos comprendidos entre algunos segundos y milésimas de segundo, dependiendo de la velocidad de rotación de la estrella de neutrones. Se observa así lo que se denomina pulsar. Si la masa de la estrella considerada es más grande que 5 veces la masa del Sol, la contracción gravitatoria no puede ser contrarrestada por la agitación neutrónica y no se puede formar una estrella de neutrones sin una catástrofe previa. Se supone que la evolución de la estrella desemboca en una gigantesca explosión, denominada Supernova Tipo II. En las estrellas masivas, sucesivas reacciones de fusión nuclear, precedidas de contracciones gravitatorias y elevaciones de temperatura en el centro de la masa, van involucrando elementos de número de masa cada vez mayor, hasta llegar al grupo del hierro. Llegado este punto las reacciones de fusión no pueden continuar, debido a la estabilidad de este núcleo, cuya energía de enlace es máxima. Como consecuencia de este proceso la estrella presenta una estructura de cáscaras concéntricas formadas por elementos químicos cuyo número atómico disminuye del centro a la periferia, rodeando a una esfera central de hierro: silicio, calcio, magnesio, neón, oxígeno, carbono, helio e 220 Aunque puede variar, disminuyendo un poco, en relación con la emisión de ondas de gravitación a partir de la dinámica asociada a las irregularidades en la estructura estelar. 259

260 hidrógeno. Toda una cebolla cósmica que contiene los elementos químicos necesarios para dar origen a los seres vivos! Cuando la estrella es lo bastante masiva, la masa del corazón de hierro supera el umbral que permite la captura de electrones por los protones, se contrae aun más y los nucleos de hierro desaparecen transformándose en neutrones, emitiendo neutrinos que abandonan el sistema. Cuando la esfera central alcanza la densidad de los nucleos atómicos se supone que se frena bruscamente la contracción de la masa estelar y que se produce una onda de choque que viaja hacia la periferia provocando una explosión gigantesca. La energía de la onda de choque se obtiene de una disminución brutal y brusca de la energía gravitatoria que se estima es del orden de los Julios en unos segundos: una verdadera bomba gravitacional. Las capas de material estelar que rodean a la esfera central son expulsadas hacia el espacio, dando origen a una nebulosa que contiene elementos químicos precursores de la vida. En consecuencia, la vida puede ser considerada como un emergente a partir del polvo de estrellas. Es en este sentido en que puede interpretarse la frase, tan poética, de Hubert Reeves citada al principio del capítulo. Como el 99% de la energía de la explosión se la llevan los neutrinos, y solamente un 1% se distribuye entre la energía cinética de los fragmentos estelares y la energía de ondas electromagnéticas, la energía luminosa en la zona visible del espectro es muy pequeña. Las supernovas son eventos raros. En 1054 se pudo observar (por astrónomos chinos) una Supernova Tipo II, que dejó como remanente la nebulosa del Cangrejo, en la constelación de Tauro. En medio de la nebulosa se halló un pulsar, estrella de neutrones formada a partir del corazón de hierro de la estrella original. En febrero de 1987 se pudo observar otra supernova de ese mismo tipo, en una galaxia satélite de la Vía Láctea, la gran nube de Magallanes. La detección de los neutrinos emitidos durante la explosión, cuando atravesaron nuestro planeta, aportó un elemento confirmatorio a la teoría de las supernovas. Ambos eventos, el del año 1054 y el del año 1987 se pudieron observar a simple vista Agujeros negros Luego de la explosión, se supone que el corazón de materia estelar no dispersado puede terminar ya sea estabilizado en una estrella de neutrones, ya sea en un agujero negro, dependiendo de si su masa no supera o supera, respectivamente, un valor umbral relacionado con el valor crítico de 6c del numero de neutrones. Cuando ese umbral de masa es superado, la energía gravitatoria liberada por la contracción del sistema es mayor que la energía asociada a la masa de reposo de los neutrones y comienza el proceso que conduce a la formación de un agujero negro, dentro del cual el campo gravitatorio sería tan intenso que impediría la salida de la radiación. Actualmente se aceptan dos tipos de agujero negro: los agujeros negros debidos al colapso gravitatorio de una estrella lo bastante masiva y los agujeros negros 221 En cuanto a las Supernovas Tipo I, dos eventos pudieron ser observados a simple vista: uno en 1572, descripto por Tycho Brahe, y otro en 1603, descripto por Johannes Kepler. 260

261 denominados super-masivos que se manifiestan como quásares 222, presentan masas del orden de al menos 10 6 veces la masa del Sol, y parecen encontrarse en el centro de las galaxias (al parecer hay uno en el centro de nuestra Vía Láctea). Otros tipos de agujero negro que han sido propuestos, como los denominados primordiales (se habrían formado por fluctuaciones cuánticas durante las primeras etapas del Universo), los mini-agujeros negros y los agujeros negros denominados de masa intermedia, no cuentan por el momento con una evidencia adecuada, ya sea basada en observaciones astronómicas, ya sea basada en los resultados de experimentos como los que se están llevando a cabo en el gigantesco acelerador de partículas, conocido como el gran chocador de hadrones (Large Hadron Collider) del CERN. En 1798, especulando sobre las condiciones en las que la luz quedaría atrapada por el campo gravitatorio de un cuerpo, Laplace 223 publicó una deducción de lo que ahora, en el marco de la teoría generalizada de la relatividad, denominamos radio de Schwarzschild. El argumento de Laplace fue el siguiente. Para que una partícula pueda escapar del campo gravitatorio de un cuerpo esférico de masa M y radio E, partiendo de la superficie del cuerpo, debe poseer una velocidad radial v que verifique la desigualdad 1 2 ^ G-M 2 2-G- M v >. Si v < no podrá escapar del campo de gravedad. Suponiendo 2 R R que la luz se ve afectada por el campo gravitatorio como una partícula, Laplace sustituyó la velocidad de la luz en lugar de la velocidad de la partícula y reordenando la desigualdad dedujo que si R < 2 G, M la luz quedaría atrapada por la gravedad y c 2 entonces no podríamos ver ese cuerpo: todo un agujero negro, tal como lo definió Eddington en 1935, en la cita presentada al comienzo del presente capítulo. Ahora bien, 2-G-M = r s no es otra cosa que la fórmula para el radio de c2 Schwarzschild. Para este valor de la coordenada radial 224 se forma una superficie atrapada rodeando a la distribución esférica de masa, que impide a la luz atravesarla y escapar al infinito. Desde otro punto de vista, un agujero negro es lo que queda luego de un colapso gravitacional completo de un cuerpo. Se supone que el tiempo-espacio se encuentra tan distorsionado que ni las partículas ni la radiación pueden salir. 222 Los quásares son fuentes de ondas de radio, sumamente intensas y situadas a distancias cosmológicas. Su enorme radiación sugiere una masa extremadamente grande, mientras que la rapidez con que varían sugiere un radio extremadamente pequeño. Por este motivo cabe suponer que son agujeros negros. 223 P. Laplace "Systeme du monde'", libro V, capítulo VI. Eddington llamó la atención sobre este aspecto precursor de la obra de Laplace en la página 6 de su libro "Internal constitution of stars", Cambridge University Press, U.K., Pero, al parecer, Laplace no fue el primero en especular sobre la posibilidad de que la luz pudiera se atrapada en un campo gravitatorio, resultando de esto la invisibilidad del cuerpo generador del campo. En 1783 John Mitchell conjeturó la existencia de estrellas oscuras para las cuales la velocidad de escape sería mayor que la velocidad de la luz. 224 Que como hemos visto en 11.2 no es igual a la distancia radial, debido a la curvatura del espacio, cosa que Laplace no podía saber dado que utilizaba un marco de mecánica newtoniana, el Unico disponible por aquel entonces. 261

262 Un cuerpo que sea atrapado por un agujero negro pierde su identidad: dos agujeros negros formados a partir de materiales diferentes previo al colapso, no parece que puedan distinguirse uno del otro si poseen la misma masa, la misma carga eléctrica y el mismo momento angular. Estas tres propiedades influyen sobre las órbitas de los objetos que se mueven en torno o pasan cerca de un agujero negro, y así pueden en principio ser indirectamente estimadas. El colapso de un cuerpo de masa M y radio R puede analizarse en el marco de la teoría newtoniana, considerando una masa distribuida con densidad uniforme, con una simetría esférica perfecta en torno a un centro e incapaz de desarrollar presión alguna que pudiera oponerse al efecto de la gravedad. Este podría ser un modelo de mecánica clásica, muy simplificado, de una estrella fría, que no rota. Consideremos un elemento de masa situado a una distancia r(t) del centro de la estrella. Si esta se contrae de modo tal que la densidad p(t) permanece uniforme, entonces r (t) = % R(t). Para cada elemento de masa % es un número comprendido entre 0y 1. E rn nces si M(r(t )) = # ) r3 (t ) es I a masa encern^ en d in.eric de rnut esto..,, d-,d 2,, GM(r(t)) G %% M deradior( ' ): dt- r(t) = % dt- R(t) = ~ r 4 T = De donde el radio variable en el tiempo, verifica la ecuación diferencial R = - G r M. Si suponemos que en el instante inicial R(0) = R 0 y d-r^} = 0, la solución viene dada por la fórmula: i f 1 R1 R i + arcsen R 0 J R 0 iv i- "A f R 0 J 1 G^ M 1 A partir del análisis de esta solución se constata que el radio de la esfera disminuye entonces desde su valor inicial hasta cero en un tiempo finito, siendo p 0 la densidad R 03 I 3n inicial: T, = n, -,' La densidad final es infinita. colapso 2 ^ G M 16 G^ p 0 Si la distribución de masa no posee simetría esférica perfecta o si el material estelar es capaz de responder desarrollando un campo de presiones, el colapso hacia una singularidad caracterizada por una densidad infinita no se produce. Lo visto en el capítulo 11 sugiere que las correcciones que la teoría generalizada de la relatividad introduce a la teoría newtoniana de la gravitación son proporcionales G^M r*., t i l a =. Entonces esas correcciones pueden no tenerse en cuenta en el caso de la c 2 F - R - R mayoría de los objetos astronómicos, incluyendo planetas, enanas blancas, estrellas e incluso cúmulos de estrellas, porque para ellos R r es despreciable respecto de la unidad. Pero en general hay que tener en cuenta las correcciones relativistas en el caso de las estrellas de neutrones y siempre en el caso de los agujeros negros. R 0 3 J 262

263 Un modelo relativista muy simplificado de un agujero negro, sin rotación, se puede obtener a partir de los elementos de teoría presentados en los capítulos 11 y 12, aplicados a una nube de polvo cósmico que se contrae bajo su propia atracción gravitatoria 225. Es posible suponer que en el interior de la nube el estado del tiempo-espacio- materia se puede describir mediante la métrica estándar de Friedmann-Lemaítre-Robertson-Walker correspondiente a un espacio esférico, pero acotando la coordenada radial de modo de definir una superficie límite que permita una conexión con la materia situada en el exterior. En el exterior la nube se supone que el tiempo-espacio se puede describir con la métrica de Schwarzschild. A medida que la contracción progresa, en este modelo la energía gravitatoria de la materia de la nube de polvo se transforma en energía cinética, permaneciendo constante la masa-energía total. Debido a la extraordinaria densidad que cabe esperar en el interior de un agujero negro, el estado de la materia debe ser tal que para describirlo se requiere de leyes que combinan la mecánica cuántica con la relatividad generalizada en un marco de teoría unificado, todavía en desarrollo 226. Así pues, una descripción mediante un universo esférico no puede ser adecuada desde un punto de vista astrofísico. No obstante, en el exterior del horizonte de eventos cabe esperar que las soluciones de las ecuaciones del campo gravitatorio como la de Schwarzschild y su generalización, debida a Reissner y Nordstrom, para tener en cuenta la carga eléctrica en el caso de un agujero negro que no rota respecto de un observador alejado, o la solución de Kerr para un agujero negro en rotación, permitan una descripción adecuada desde el punto de vista astrofísico. En general, los modelos relativistas 227 predicen que si un observador se moviera con la materia de la estrella que colapsa en el agujero negro, una vez cruzado un horizonte de eventos (la superficie atrapada) se precipitará en el interior y se vería aplastado por densidades que crecen sin límite. Luego de un intervalo finito y muy corto de tiempo propio, el observador en co-movimiento con la materia habrá completado el colapso: las dimensiones se habrán encogido hasta formar una singularidad. Para ver cómo puede ocurrir esto, consideremos el intervalo en el caso de un movimiento a lo largo de la coordenada radial de la métrica de Schwarzschild: 225 R. Ruffini y J. Wheeler "Introducing the black hole", Physics Today, Vol. 24, 1971, pp F. Cernuschi, quien dirigió mis estudios universitarios de física, llamaba estado X al estado de la materia en estas condiciones. Si bien estado X no es en sí mismo otra cosa que un nombre, llama convenientemente la atención sobre las diferencias que cabe esperar en relación con las propiedades conocidas de la materia, diferencias que a veces se subestiman. Cernuschi (uruguayo educado en Argentina) y Chandrasekhar (indo) fueron condiscípulos en uno de los cursos de relatividad generalizada que impartió Eddington, a comienzos de la década de Eran los Unicos alumnos en ese curso! 227 S. Chandrasekhar 'The mathematical theory of black holes", Clarendon Press, Oxford, D. Raine y E. Thomas "Black holes: an introduction", Imperial College Press, Londres, G. Hooft "Introduction to the theory of black holes", Lectures presented at Utrecht University,

264 r r A r r A -1 ds 2 = c Zl -dt ^ -dr 2 V r j En función del parámetro u : = c 2 -I 1 V 1 - ^ dr = F?' r? dr El movimiento del cuerpo siguiendo una trayectoria (t(u), r(u)) en el tiempo-espacio curvado por la masa M, del agujero negro y que pase por dos posiciones (t(u l ),r(u l )) y (t(u 2 ), r (u 2 )) dadas, deberá ser una geodésica temporaloide en ese tiempo-espacio. En consecuencia minimizará, como vimos en , la integral: / F (u) / \ dr (u) r (u) ^ Las ecuaciones de Euler correspondiente a este problema de cálculo de variaciones son: d_ du r A r A df dt o V du J dt = 0 d_ du df dr o V du J df dr = 0 Teniendo en cuenta la definición de F, la ecuación de Euler para la coordenada df c *A-* temporal se reduce a: r J du = H = cte dt d F du Si elegimos el tiempo propio T como parámetro, F = c y en consecuencia se verifica: dt H _ dt í A Sustituyendo este resultado en la expresión de F = c se deduce 1 S que V dt J = H 2 - c 2 1 r Si el movimiento comienza del reposo (respecto del observador inercial en el infinito) y lejos del horizonte r = r S del agujero negro, en un dr punto de coordenada radial r = r 0, con = 0 en ese punto, la constante de integración dt dr A = 2 'S S Entonces I ~ j = c queda determinada: H 2 = c ^ V r 0 J V r r 0 J Además, si se asume que la coordenada temporal y el tiempo propio crecen al unísono dt de modo que t > 0, la constante debe ser positiva: H - + c 1 ^^^ r En consecuencia: dt dt c- H 1- S = +c- 1 - Zl \ Z 1- S 264

265 dr _ Puesto que el cuerpo se dirige hacia el agujero negro, ~ = ~ c Separando variables e integrando entre T = 0 (cuando r = r 0 ) y r < r 0 ) se obtiene: Ver ) r + r 0 arcsen f Vi V = c r 0 J i 1 ^ -1 r T (para un valor A medida que el tiempo propio aumenta, la coordenada radial disminuye aproximándose a cero, donde se encuentra la singularidad. En el límite, cuando r = 0, s se tiene ^ arcsen (1) = c- T. Como arcsen(l) = n, el intervalo de tiempo propio insumido en alcanzar la singularidad verifica: El intervalo de tiempo T s insumido en llegar al radio de Schwarzschild viene dado por f la expresión implícita: r r. r 0 arcsen 1 =c s Ts 0 J Como supusimos que es despreciable, es posible desarrollar las funciones del r 0 r miembro de la izquierda en potencias de con lo cual se obtiene la aproximación: T s c r< s T 3 ^ i V r 0 J Entonces el intervalo de tiempo T, - T s propio requerido para caer desde el horizonte de eventos, situado en r = r s 3 n 2-c hasta la singularidad central del agujero negro, situada en 2 r s r = 0 se puede estimar en:! c Así pues, un cuerpo que se deja caer desde el reposo, a partir de un valor de su coordenada radial muy grande respecto del radio de Schwarzschild de un agujero negro que no rota, emplea un intervalo finito de tiempo propio en alcanzar la singularidad situada en el origen de coordenadas. Al parecer no pasa nada extraño cuando el cuerpo, considerado como una partícula, atraviesa el horizonte del agujero negro. No obstante, si se trata de un cuerpo extenso, la curvatura del tiempo-espacio produce que las partículas que viajan por geodésicas próximas se encuentren aceleradas unas respecto de las otras, lo cual tiene como consecuencia la deformación del cuerpo extenso y su eventual destrucción 229. s s 3 [s_ c 229 Ver, por ejemplo, el capítulo 6 del libro de R. Lambourne, "Relativity, gravitation and cosmology", Cambridge University Press, U.K

266 dt dr partir de las fórmulas obtenidas para ~ y "dt se deduce, para r S < r < r 0 : dt dt t (r ) = - 1 -, r í ( ' /, - r S r0 ( r - r S ) - V r 0 - r d r ' 2-G- M, Cuando la coordenada radial se aproxima a r S = 2 c la integral diverge a x. Entonces, como la coordenada temporal corresponde al tiempo tal como lo determina un observador inercial muy alejado, respecto del cual la masa del agujero negro se halla en reposo, para este observador inercial el tiempo de aproximación al horizonte de eventos ( r = r S ) desde r = r 0 es infinito. A diferencia de la teoría basada en la física clásica, ni el apartamiento de la simetría esférica en la distribución de masa ni la presión modifica el resultado final cuando el análisis se basa en la teoría generalizada de la relatividad. Esto ocurre por las siguientes razones. El apartamiento de la simetría esférica no importa en la medida en que el colapso se produzca en el interior de la región definida por r S. La respuesta de presión contribuye a la masa inercial y cuando el radio de la masa que colapsa se aproxima a r S la contribución de la presión a la masa inercial se hace comparable a la de la densidad, de modo que la presión termina por contribuir al colapso gravitatorio. Se considera que una vez que la materia atraviesa el horizonte de eventos de un agujero negro, no lo puede abandonar: los agujeros negros no emiten ni radiación ni partículas. No obstante, las partículas cargadas que pasan por las cercanías de un agujero negro y son finalmente atrapadas, alcanzan aceleraciones tan grandes al aproximarse al horizonte de eventos que emiten radiaciones X y gamma. Por este motivo se emplean detectores de rayos X ubicados en sondas espaciales con la intención de detectar agujeros negros, no a través de sus emisiones, pues los agujeros negros no emiten, sino a través de las emisiones de las partículas cargadas de la materia vecina debidas a los efectos de la interacción gravitatoria con el agujero negro. Supongamos que un observador en co-movimiento con la materia que forma la superficie de la estrella que se colapsa, emite pulsos de ondas de radio de frecuencia f 1 (segun su propio reloj) y longitud de onda Á 1 (segun su propia regla) y que esas ondas son captadas por un observador que se encuentra muy alejado en relación conr S. Mientras que la coordenada radial E que caracteriza la posición de la superficie de la estrella sea mayor quer S, un observador alejado recibirá la señal de radio y determinará que presenta una frecuencia que disminuye tendiendo a cero y una longitud de onda que aumenta tendiendo a infinito a medida que el radio de la estrella se aproxima al radio de Schwarzschild. Una vez que el radio E de la estrella coincide con r S, el colapso continua pero el observador externo no recibe señal alguna. Por tanto, si el observador se encuentra lejos, solo podrá recibir información sobre las primeras etapas del colapso. 266

267 Luego de un intervalo infinito de tiempo propio de este observador externo, el colapso gravitatorio todavía no se habrá completado. Lo que este observador vería, es que a medida que su tiempo propio tiende a infinito, se iría completando la aproximación a una configuración estática correspondiente al (km). Esto se conoce como "escenario de la c2 masa.solar estrella congelada". La relajación del radio de la estrella al radio de Schwarzschild, y por tanto, el proceso luego del cual el observador externo pierde contacto con el observador ligado a la materia que colapsa, se presenta en forma exponencial, con un tiempo característico de 10 microsegundos para una masa del orden de la del Sol. Una consecuencia de esta doble descripción, en un caso por un observador alejado y en reposo respecto del agujero, y en el otro caso un observador en co-movimiento con la materia atraída hacia el agujero, es la imposibilidad de asignar un valor del tiempot, en el que ocurren los eventos que determina el primer observador, para cada valor que puede tomar el tiempo propio T, en el que ocurren de los eventos que determina el segundo observador. Parte de la experiencia del segundo observador, acelerado respecto del primero (que a su vez puede considerarse fijo a un marco inercial), se desarrolla para valores de T que no tienen equivalente en la experiencia del primer observador. Parte de la evolución del universo del segundo observador debe ocurrir entonces fuera del universo del observador inercial, porque el tiempo de este último literalmente se agotó. Como se mencionó en 8.6, este tipo de situación entra en contradicción con el principio según el cual la equivalencia entre todos los posibles sistemas de referencia para describir el mundo físico debería implicar que existe una correspondencia entre los instantes que dos observadores atribuyen al mismo evento tal que a cada instante determinado por uno de ellos le corresponda un único instante determinado por el otro para el mismo evento. Es decir, los eventos que acontezcan en la experiencia finita de un observador también deben acontecer en la experiencia finita de otro observador: unus mundus, hay un solo mundo (físico). Evidentemente las consecuencias de los modelos relativistas más aceptados para describir los agujeros negros implican que no se cumple el principio mencionado: no hay un solo mundo físico en el sentido que le hemos dado a esta expresión. Recientemente se han comenzado a proponer algunos modelos alternativos, como el de S.N. Zhang y Y. Liu 229, que analizan una cáscara de materia que cae hacia un agujero negro y concluyen que el "escenario de la estrella congelada" no se presentaría en realidad: no habría singularidad ni se formaría un horizonte de eventos en la cáscara de materia durante todo el proceso. Como las estrellas que pueden dar origen a un agujero negro por lo general rotan, un modelo más exacto requiere tener en cuenta esta rotación. En 1963 Kerr halló una generalización de la solución de Schwarzschild que permite tener en cuenta el momento 229 S. N. Zhang y Y. Liu "Observe matter falling into a black hole", Physics Department and Center for Astrophysics, Tsinghua University, Pekín, octubre de

268 angular del cuerpo 230. La métrica de Kerr define un horizonte de eventos, pero predice la existencia de otra superficie, denominada el límite estacionario, que se ubica por fuera del horizonte de eventos, con el cual coincide en los polos donde el eje de rotación corta la superficie atrapada. (Figura 13.1) Figura 13.1 Esquema del horizonte de eventos, el límite estacionario y la región comprendida entre ambos (ergo-esfera) según la métrica de Kerr. Se indica el eje de rotación, en posición vertical. La región comprendida entre el límite estacionario y el horizonte de eventos, denominada ergo-esfera a sugerencia de Wheeler y de Ruffini, se caracteriza porque al entrar en ella desde el exterior respecto del agujero negro, la coordenada temporal deja de ser una cantidad temporaloide y pasa a ser una cantidad espacialoide. Parecería que una consecuencia de esta transmutación del tiempo sería el hacer posible una especie de convertidor de energía cósmico. Se basaría en un proceso de entrada en la ergo-esfera de un cuerpo dotado de una cierta energía positiva (asociada a su masa, es decir, energía de reposo más energía cinética) y su ruptura en dos fragmentos, uno de los cuales, juzgado por un observador muy alejado, tiene energía negativa. Asumiendo la validez del principio de conservación de la energía, el otro fragmento debe tener una energía aun mayor que la que tenía el cuerpo original al ingresar. Si este fragmento más energético escapa a lo largo de una geodésica y se aleja del agujero negro, mientras que el fragmento con energía negativa cruza el horizonte de eventos y es tragado por el agujero, entonces la energía de rotación del agujero negro habrá disminuido porque su momento angular se habrá reducido. Introdujimos una partícula con cierta energía y obtuvimos una partícula con más energía que la que ingresó y desencadenó el proceso. Este resultado, debido a Penrose, implica que en principio un agujero negro puede funcionar entregando energía. 230 La métrica de Kerr fue extendida por Newman para poder describir el exterior de un agujero negro con masa, carga eléctrica y momento angular. Ver, por ejemplo S. Chandrasekhar "The mathematical theory of black holes", Clarendon Press, Oxford, 1983; D. Raine y E. Thomas "Black holes: an introduction", Imperial College Press, Londres, 2005; G. Hooft "Introduction to the theory of black holes", Lectures presented at Utrecht University,

269 Otro resultado curioso, sugerido por el análisis del colapso gravitatorio realizado por Penrose, es que el colapso puede abrir una conexión con otro universo con el cual no teníamos comunicación. Pero mientras que el convertidor de energía cósmica es en principio comprobable por un observador externo, la apertura de una puerta a otro universo no parece serlo. Viene a cuento la parábola que Chandrasekhar aprendió en la India, siendo niño, y que aparece como última de las citas con las que comenzó este capítulo. Existirá en nuestro caso el equivalente de la rana? 269

270 14. Aspectos vinculados con la lógica de la investigación científica "Estoy completamente de acuerdo con usted sobre la importancia y el valor educativo de la metodología tanto como de la historia y la filosofía de la ciencia. Tanta gente hoy en día- aún científicos profesionales- me parece como alguien que ha visto miles de árboles pero nunca ha visto un bosque. Un conocimiento del marco histórico y filosófico suministra esa independencia de los prejuicios de su propia generación, prejuicios que sufren la mayoría de los científicos. Esta independencia, posibilitada por la penetración filosófica es-en mi opinión-la marca distintiva de un verdadero buscador de la verdad respecto de un mero artesano o un especialista. " Albert Einstein en una carta a Robert Thornton, el 7 de diciembre de "La relación recíproca entre la epistemología y la ciencia es de un tipo notable. Son dependientes una de otra. La epistemología sin contacto con la ciencia se transforma en un esquema vacío. La ciencia sin epistemología es-en la medida en que se la pueda concebir-primitiva y embarrada. No obstante, tan pronto como el epistemólogo encuentra el sistema que busca, se ve inclinado a interpretar el contenido de pensamiento de la ciencia en términos de ese sistema y a rechazar todo lo que no se ajusta a su sistema. El científico no puede llevar tan lejos su esfuerzo por una sistematización epistemológica. Acepta agradecido el análisis de conceptos que suministra la epistemología; pero las condiciones externas que le son impuestas por los hechos experimentales, no le permiten restringirse demasiado en la construcción de su mundo conceptual por adherir a un sistema epistemológico. Por ello, el científico aparece frente al epistemólogo como un tipo de oportunista sin escrúpulos: aparece como realista en la medida en que busca describir un mundo independiente de los actos de percepción; un idealista en la medida en que concibe los conceptos y las teorías como invenciones libres del espíritu humano (que no se pueden deducir en forma lógica a partir de lo empíricamente dado); como un positivista en la medida en que considera que sus conceptos y teorías se justifican solo en la medida en que suministran una representación lógica de las relaciones entre las experiencias sensoriales. El científico puede incluso aparecer como un platónico o un pitagórico, en la medida en que considera la perspectiva de la simplicidad lógica como una herramienta indispensable y efectiva para su investigación. " A. Einstein en P. Schilpp "Albert Einstein: philosopher-scientist", The Library of Living Philosophers, Evanston, IL, 1949, pp Una vez finalizada una revisión de algunos de los antecedentes y contenidos de la teoría de la relatividad, así como de algunas de sus aplicaciones astronómicas y cosmológicas, es conveniente re-examinar la teoría, teniendo en cuenta aspectos epistemológicos, psicológicos, socio-culturales e históricos. El valor de verdad de una teoría, visto desde un punto de vista estrictamente lógico y metodológico, es independiente de las condiciones concretas, psicológicas y socioculturales que acompañaron su génesis. 270

271 Pero como señala José Ortega y Gasset 231, una teoría es un cuerpo de pensamientos que "nace en un alma, en un espíritu, en una conciencia, lo mismo que el fruto en el árbol x sus peculiaridades acusan ciertas tendencias específicas en el alma que la ha creado...". Por otra parte, parecería que si una teoría de gran envergadura, como sin duda lo es la teoría de la relatividad, puede surgir y prosperar en un momento histórico determinado, ello es posible porque de un modo u otro, las personas contemporáneas, sus pensamientos, sus sentimientos, "han tomado espontáneamente determinada ruta. las ideas, cuanto más sutiles y técnicas, cuanto más remotas parezcan de los afectos humanos, son síntomas más auténticos de las variaciones profundas que se producen en el alma histórica.". Además de las condiciones que impone el espíritu de la época en relación con las ideas de la teoría de la relatividad, es interesante prestar atención a las circunstancias de la vida personal y a las características psicológicas tanto de Einstein como de otros pioneros en la construcción de la física relativista, y cómo estas características influyeron en el desarrollo, la estructuración y la posterior aceptación generalizada de la física relativista. Comencemos entonces por analizar en este capítulo algunos aspectos relevantes de la estructura lógica de las teorías restringida y generalizada de la relatividad, como teorías físico-matemáticas, para después considerar la cosmología desde ese mismo punto de vista. Luego, en el capítulo siguiente, centraremos nuestra atención en ciertos aspectos psicológicos y socio-culturales relacionados con el principio de relatividad, de interés desde el punto de vista epistemológico La estructura de las teorías físico-matemáticas En toda teoría físico-matemática se puede distinguir tres partes indisolublemente interrelacionadas: (a) las ecuaciones propias de la teoría, (b) las reglas lógicas y las herramientas matemáticas que permiten efectuar inferencias deductivas a partir de las ecuaciones, y (c) los enunciados que establecen el significado físico de los símbolos y las palabras tales como longitud, tiempo, masa, simultaneidad, fuerza. Es decir, una teoría física consta de lo que Carnap 232 llamaba el primer cálculo (las relaciones entre símbolos específicas de la teoría física considerada), el segundo cálculo (que establece qué transformaciones se pueden llevar a cabo a partir de las ecuaciones de la teoría sin alterar su significado) y las reglas semánticas 233 (que establecen una conexión con el lenguaje comun y definen el significado físico de determinados 231 J. Ortega y Gasset "El Sentido Histórico de la Teoría de Einstein", segundo apéndice a "El tema de nuestro tiempo", Tecnos, Madrid, R. Carnap "Fundamentación lógica de la física", Sudamericana, Buenos Aires, En su acepción más general, la semántica comprende el estudio del significado de los símbolos, así como de las combinaciones de símbolos y las operaciones que se efectuan con símbolos. El significado de las fórmulas de una teoría física se puede abordar desde tres disciplinas: lógica, matemática y física. Desde el punto de vista lógico (semántica lógica) las fórmulas se consideran proposiciones que se suponen son verdaderas. Desde el punto de vista matemático (semántica matemática) son relaciones entre variables que toman valores numéricos, expresadas mediante igualdades (o menos frecuentemente, desigualdades). Desde el punto de vista físico (semántica física) expresan leyes de la naturaleza. 271

272 símbolos a través de lo que Percy Bridgman 234 operacionales). propuso denominar definiciones En una primera etapa de construcción de una teoría física predominan los procesos de inferencia no deductiva usualmente englobados en lo que se suele denominar síntesis inductiva. Durante esta etapa, las características psicológicas de los investigadores y la influencia de la cultura dentro de la cual se lleva a cabo el trabajo, generalmente presentan una mayor incidencia respecto de lo que se observa en las etapas siguientes. Estas son la segunda etapa, de estructuración axiomática, y la tercera etapa, de deducciones cuyos resultados son contrastables experimentalmente. Una observación cuidadosa del trabajo de las personas que construyen teorías, muestra que las tres etapas se mezclan entre sí. En particular, los tanteos propios de la etapa inductiva se acompañan de conjeturas acerca de postulados posibles e inferencias deductivas acompañadas de comparaciones con resultados experimentales ya conocidos. No obstante, en esta primera etapa las características psicológicas condicionan el énfasis que la persona pone sobre tal o cual aspecto de los problemas examinados, orientan el esfuerzo intelectual e inciden en el clima emocional que acompaña e influye sobre los resultados del trabajo 235. Pero una vez que la teoría se ha desarrollado lo suficiente, es posible deducir predicciones acerca de los resultados de experimentos u observaciones cruciales, que todavía no han sido efectuados, pero cuya ejecución resulta de suma importancia para validar o descartar la teoría. Esto a su vez conduce a considerar el requisito de 234 P. Bridgman "The logic of modern physics" New York, La definición operacional de una magnitud física establece el procedimiento experimental que en cada caso permite determinar su valor, o la expresa como función de magnitudes para las que dicho procedimiento ha sido establecido. Antes de la aparición de la mecánica cuántica, los errores accidentales, inevitables en cualquier medición física, se consideraban, como fenómenos más o menos irrelevantes. Se suponía que en el límite esos errores podrían ser evitados construyendo aparatos de medida cada vez mejores: esto se relaciona con el concepto de convergencia interna en la medición de una magnitud física. En caso de que se disponga de varios procedimientos diferentes para determinar una misma magnitud, se exige que cumplan con el denominado requisito de convergencia externa. Sobre el concepto de convergencia externa, además de la obra de Bridgman, puede consultarse el libro de H. Margenau "La naturaleza del mundo físico", Tecnos, Madrid, Einstein tuvo una tendencia al monismo muy marcada. Siempre insistía en unificar categorías físicas diferentes interpretándolas en términos de una categoría comun, presumiblemente más fundamental. Por este motivo no le satisfacía la dualidad que la relatividad restringida introduce entre el tiempo-espacio por un lado y la materia por el otro. Esta insatisfacción lo condujo a unificar la masa gravitatoria con la masa inercial primero, y a desarrollar la relatividad generalizada como una geo-metro-dinámica después. Pero no estaba satisfecho con las ecuaciones que había obtenido para el campo gravitatorio, porque del lado izquierdo aparecía el tensor métrico y sus derivadas (lado izquierdo que para Einstein era comparable con un edificio de mármol), mientras que del lado derecho aparecía el tensor de energía-impulsión (comparable, segun él, con un edificio de madera de baja calidad). Esta insatisfacción lo motivó a perseguir durante el resto de su vida, aunque sin éxito, una teoría del campo unificado. "Ante todo se requieren nuevas teorías cuando encontramos hechos nuevos que no reciben adecuada explicación en el marco de las teorías existentes. Ahora bien, tal motivo es, por así decirlo, trivial, impuesto desde afuera. Hay otra razón, más sutil y de no menor importancia. Se trata del esfuerzo por unificar y simplificar los dominios de la teoría considerada en su totalidad." A. Einstein "Dos razones para desarrollar teorías científicas" en "Mi visión del mundo" (Edición de Carl Seelig, Tusquets, Barcelona, 1981). 272

273 falsabilidad de una teoría en el sentido establecido por Karl Popper 236. Este requisito es particularmente aplicable a la teoría de la relatividad, tanto en su versión restringida como en su versión generalizada. Las consecuencias de una teoría pueden ser puestas a prueba mediante observaciones cuantitativas o experimentos planeados con ese fin. Si se encuentra una discrepancia entre las predicciones de la teoría y las observaciones, la teoría debe ser revisada: una sola instancia confirmatoria cuyos resultados se aceptan como válidos pero que resultan incompatibles con las predicciones de la teoría, basta para asegurar la falsedad de la teoría. Pero si los resultados experimentales están de acuerdo con las predicciones de la teoría, de eso no se desprende que pueda considerársele como verdadera, sino solamente como una teoría confirmada por esos experimentos u observaciones. A veces, a partir de una segunda teoría muy diferente, inclusive en algunos aspectos, incompatible con la primera, pueden obtenerse las mismas predicciones dentro de los límites del error experimental en un dominio de aplicabilidad común a ambas. Este es el caso de la dinámica de la relatividad restringida y la dinámica newtoniana: todos los experimentos u observaciones que confirman la dinámica newtoniana, confirman también la dinámica relativista, pero el carácter absoluto de la simultaneidad de dos eventos en la dinámica newtoniana es lógicamente incompatible con su carácter relativo al observador en la otra dinámica. Por otra parte es posible realizar experimentos en condiciones tales que confirman las consecuencias de la dinámica relativista pero invalidan las consecuencias de la dinámica newtoniana, y por tanto la falsean en el sentido que le daba Popper a este término. Una situación diferente se plantea a propósitos de las teorías paralelas. Ahora se tienen dos o más teorías que en principio intentan dar cuenta de los mismos fenómenos, pero una de ellas no se reduce a un caso límite de otra de esas teorías, que entonces sería más general, como ocurre con la mecánica clásica y la mecánica relativista. Como vimos en 8.8, la mecánica relativista es la teoría dominante. Cuando se hace tender la velocidad de la luz a infinito se reduce a la mecánica newtoniana. Un ejemplo de teorías paralelas respecto a la relatividad generalizada es el constituido por las teorías escalares de la gravitación que eluden la reducción de los fenómenos gravitatorios a un movimiento libre en un tiempo-espacio-materia curvado. No obstante, casi todas las teorías escalares fracasaron en la predicción cuantitativa de al menos uno (la rotación del perihelio de Mercurio) de los cuatro efectos cruciales que se utilizaron para confrontar las consecuencias de la teoría generalizada de la relatividad con la experiencia. Como decía Paul Couderc 237 el proceso de geometrización propio de la teoría generalizada "no lo ha hecho tan mal en nuestra región del Universo: esperemos hasta que la rotación del perihelio de Mercurio sea explicada de alguna otra forma." 236 K. Popper "La lógica de la investigación científica", Tecnos, Madrid, Paul Couderc, "The expansión of the Universe", Mc Millan, New York,

274 Si bien hubo que esperar hasta 1983, esa rotación fue explicada de otra manera y con el mismo grado de confirmación experimental que presenta la predicción de la teoría generalizada de la relatividad. Esto ocurrió en el marco de una teoría escalar de la gravitación que emplea el tiempo-espacio plano de la teoría restringida de la relatividad, un campo escalar para describir la gravitación y ciertas hipótesis muy simples sobre cómo el campo gravitatorio afecta localmente las reglas y los relojes. Predice igualmente bien el corrimiento al rojo, la curvatura de los rayos de luz y el retardo en los pulsos de radar, dentro de los márgenes de error alcanzables. 238 En relación con la confirmación o invalidación experimental u observacional de las predicciones de una teoría, es importante tener presente que lo que se pone a prueba son enunciados deducidos en el marco de un sistema compuesto por las ecuaciones, las reglas de inferencia deductiva y las definiciones operacionales, y que el empleo de los instrumentos de medición y la interpretación de los resultados experimentales requiere una interpretación teórica. Así pues, cuando se intenta poner a prueba las consecuencias de una hipótesis, lo que se contrasta con la experiencia es en realidad un cuerpo de teoría completo. Debido a este carácter holístico 239 de las teorías físicas, cuando la teoría y el experimento entran en conflicto, el conflicto puede resolverse de muchas formas diferentes. Es posible modificar las ecuaciones, como hizo Maxwell con la formulación local de la ley de Ampere. A la densidad de corriente de conducción debida al movimiento de la carga eléctrica, le añadió la corriente de desplazamiento, para compatibilizar la formulación local de la ley de Ampere con la formulación local de la ley de conservación de la carga, para una distribución espacial continua de carga eléctrica, cuando la densidad de carga en un punto varía con el paso del tiempo. También se pueden modificar las definiciones operacionales, o introducir una donde no las hay, como hizo Einstein en relación con el concepto de simultaneidad. En la física clásica el concepto de simultaneidad se apoya en el postulado del transporte, que según vimos en 6.1, da por sentado que se mantienen sincronizados dos relojes que parten en el mismo instante de un punto A, de acuerdo con un reloj fijo en ese punto, y llegan simultáneamente a otro punto B, de acuerdo con el reloj fijo en ese segundo punto, pero recorren caminos diferentes para ir de A hasta B, con cualquier historia de 238 Esta teoría alternativa fue concebida en Uruguay por José Ferrari, cuando trabajaba en la antigua Facultad de Humanidades y Ciencias de la Universidad de la República. Los fundamentos de la teoría se presentan en J. Ferrari "Foundations for a theory of gravitation" Il Nuovo Cimento, vol. 78, N 1, 1983, pp Algunas aplicaciones cosmológicas se pueden hallar en J. Ferrari "Scalar gravitation and cosmology" Il Nuovo Cimento, vol. 82 B, N 2, 1984, pp P. Duhem "The aim and structure of physical theory", Princeton University Press, New York, Este libro, cuya versión original, en francés, es de 1906, fue traducido al alemán en 1908 por Friederich Adler, condiscípulo de Einstein y posteriormente colega en la Universidad de Zurich. En esos años ( ) al parecer los dos amigos conversaban a menudo sobre temas de filosofía de la ciencia, incluyendo los puntos de vista expuestos en las obras de Mach y de Duhem. Ver D. Howard "Einstein and Duhem", Synthese, vol. 83, 1990, pp En internet se encuentra el artículo de 32 páginas, también debido a D. Howard: "Einstein's philosophy of science", en la Stanford Encyclopedia of Philosophy,

275 velocidades. Einstein decidió eliminar este postulado 240 y lo sustituyó por una definición operacional de la simultaneidad para poder compatibilizar la teoría electromagnética, incompatible con la mecánica clásica, con una nueva versión de la mecánica, la mecánica relativista. En general, para cada teoría física es posible identificar un dominio experimental dentro del cual las predicciones de la teoría están de acuerdo con los resultados de los experimentos: ese dominio se suele denominar dominio de adecuación de la teoría. Si tenemos dos sistemas formales, ambos confirmados por los experimentos dentro de sus correspondientes dominios de adecuación, pero inconsistentes entre sí, generalmente hallamos que las inconsistencias se producen por suposiciones no operacionales, es decir, no conectadas con las mediciones u operaciones físicas en el laboratorio. Esas suposiciones no operacionales pueden ser eliminadas sin perder el grado de acuerdo con la experiencia que ya ha sido alcanzado. De hecho, desarrollos posteriores destinados a eliminar las inconsistencias, a menudo originan una expansión extraordinaria del intervalo de concordancia con la experiencia. Eso fue lo que pasó cuando la mecánica newtoniana fue generalizada a la mecánica relativista. El dominio de adecuación de esta Ultima teoría incluye al dominio de adecuación de la mecánica newtoniana, pero involucra además experimentos en los cuales las velocidades no son despreciables respecto de la velocidad de la luz. Desde este punto de vista el análisis operacional de Einstein sobre el concepto de simultaneidad fue un medio para un fin, pues hizo posible integrar la mecánica de partículas con la electrodinámica clásica. El concepto de simultaneidad absoluta, fundado en el postulado del transporte, fue abandonado porque impedía la integración. Como el concepto absoluto de simultaneidad no tiene una base operacional, aunque psicológicamente es muy natural, el cambio en los fundamentos de la mecánica se pudo llevar a cabo de manera relativamente menos traumática que si hubiera sido necesario modificar una definición operacional. A veces se puede introducir modificaciones inclusive en las reglas de inferencia deductiva, de modo que algunas de las consecuencias de un cuerpo de teoría se mantengan inalteradas. En todo caso, lo que se confirma poniendo a prueba una consecuencia obtenida por inferencia deductiva, generalmente no es una hipótesis sino un cuerpo de teoría Sigue habiendo polémica sobre si la definición de simultaneidad de Einstein es o no puramente convencional. Ver el artículo de A. Janis "Conventionality of simultaneity" en la Stanford Encyclopedia of Philosophy (2010). 241 En relación con esto Ultimo, Russell (B. Russell "The scientific outlook", New York, 1931) ponía un ejemplo de lógica elemental, pero que constituye un análogo ilustrativo. De las proposiciones "el material que compone el pan es harina de trigo" y "la harina de trigo es nutritiva" se desprende que "el pan es nutritivo". Supongamos ahora que alguien modifica los enunciados mencionados, de modo tal que plantea como una primera hipótesis de trabajo que "el material que compone el pan es el polvo de roca", y añade una segunda hipótesis: "el polvo de roca es nutritivo". Si se admite la verdad de estos dos enunciados modificados, se deduce nuevamente que el pan es nutritivo. Si bien se obtiene una confirmación experimental de este Ultimo enunciado, esta confirmación no se puede asignar a las hipótesis de partida, sino solamente a la consecuencia lógica de su combinación, es decir, lo que es confirmada es una consecuencia lógica del sistema formado por las dos proposiciones y la confirmación no recae sobre las hipótesis tomadas por separado. 275

276 14.2 El principio de relatividad y la teoría de la relatividad En la teoría generalizada la materia y el tiempo-espacio se determinan entre sí, formando una totalidad indisoluble. En la teoría restringida la materia no afecta la estructura del tiempo-espacio, el cual se mantiene como algo externo que determina el modo de existencia de los fenómenos pero no se ve afectado por éstos. Esta diferencia es notable, preocupó a Einstein y lo acicateó para desarrollar la teoría generalizada y puede servir de guía con el fin de determinar y examinar posibles estructuras axiomáticas para la teoría de la relatividad. Otra posibilidad es poner énfasis en los observadores y en la invariancia de las leyes físicas cuando se pasa de la descripción tal como la efectúa un observador a la descripción tal como la efectúa otro observador. Esto conduce a analizar ciertas simetrías inherentes al mundo físico y utilizarlas como postulados para fundamentar la teoría. Eugen Wigner, una de las personas que en el siglo XX pensó con más profundidad sobre el concepto de simetría y sus implicaciones en las ciencias físicas, ponía énfasis en el nuevo rol que, a partir del surgimiento de la teoría de la relatividad, tuvieron las consideraciones relacionadas con la simetría en la física teórica 242. Antes del surgimiento de la física relativista, los principios de invariancia asociados con la simetría se deducían de las leyes físicas. Después de ella, al menos parte de las leyes físicas fundamentales se dedujeron a partir de consideraciones de invariancia asociadas con simetrías en el tiempo y el espacio. Conviene entonces partir de un postulado que introduce observadores equivalentes, cada uno con un marco espacial y un marco temporal, de modo que a menos de cambios de coordenadas admisibles, asignan una cuaterna consistente en un instante de tiempo y de tres coordenadas espaciales a cualquier suceso o evento. Supondremos que el observador puede utilizar, al menos localmente, un espacio euclidiano para describir el ordenamiento espacial de los eventos. Para concretar, podemos considerar que emplea un sistema de coordenadas cartesiano. Las transformaciones de coordenadas admisibles, que no modifican la descripción de los eventos realizada por un mismo observador, son traslaciones y rotaciones en el espacio y traslaciones en el tiempo. Parece razonable suponer que todos los observadores han de ser equivalentes en el sentido que todos ellos deben poder describir los mismos sucesos, cada uno desde su propia perspectiva, y que han de poder observarse entre sí. Esto excluye del ámbito de la teoría que se considera tanto el caso de los universos múltiples como algunas consideraciones especulativas sobre los agujeros negros. Por supuesto, sobre otras bases podrían no excluirse. Suponemos ahora que para cada par de observadores y para cada suceso, existe una función que vincula las coordenadas del suceso respecto de los marcos de espacio y tiempo que le asigna un observador con las coordenadas de espacio y tiempo del mismo suceso tal como se las asigna el otro observador. Esa función se supone uno a uno y lo bastante regular como para tener derivadas parciales continuas hasta el orden que sea 242 E. Wigner "Symmetries and reflections", Indiana University Press, Bloomington, USA,

277 suficiente 243. En símbolos: x ] = f 3 (x 0,x 1,x 2,x 3 ) con j = 0,1,2,3 donde las coordenadas poseen el significado que se les atribuyó en 10.2: la primera expresa el instante y las otras tres representan las coordenadas de posición. Al combinar las transformaciones de coordenadas admisibles para un mismo observador con las transformaciones que vinculan las coordenadas de un evento tal como son determinadas por ese observador con las coordenadas que le asigna a ese mismo evento otro observador equivalente, resulta un grupo (continuo) de transformaciones 244. Hasta este momento hemos concretado el marco espacial y el marco temporal de cada observador. Para un observador dado tiempo y espacio aparecen separados. Si se interrelacionan, esa interrelación solo puede aparecer en las transformaciones que conectan las coordenadas de tiempo y espacio de un mismo evento registradas por diferentes observadores. Siguiendo el camino histórico hacia la teoría de la relatividad, es en este punto donde se introduce la meditación sobre el tiempo y el planteo de una solución operacional al problema de la simultaneidad, basado en el postulado de constancia de la velocidad de la luz en los marcos de referencia inerciales, cuya existencia se admite. Esto implica una restricción tanto sobre lo que se considera observadores equivalentes como sobre las transformaciones admisibles de coordenadas del mismo evento visto por distintos observadores. Vía la invariancia del intervalo conduce finalmente al tiempo-espacio de Minkowski de la relatividad restringida: una variedad tetra-dimensional plana. Luego aparece la meditación sobre la igualdad de los valores de la masa inercial y gravitatoria y la idea de igualar localmente un movimiento acelerado con un movimiento en un campo gravitatorio. Se amplía el conjunto de observadores equivalentes y se generaliza el concepto de intervalo para corresponder a una variedad tetra-dimensional curvada por la presencia de la materia, tal que la variedad tangente en cada uno de sus puntos es un espacio de Minkowski. Entonces, en vez de seguir el camino histórico, se puede postular desde el inicio una estructura métrica 245 (o con mayor precisión, seudo-métrica) para la variedad formada por todos los eventos posibles, variedad cuyo intervalo ds viene dado por la forma 3 diferencial cuadrática ds 2 = ^ g ik dx'dx k caracterizada por los coeficientes tensoriales i,k=0 g i k (x 0, x 1, x 2, x 3 ), tal como vimos en para una variedad de n dimensiones (dimensiones que ahora restringimos a cuatro). Vistas las cosas desde la perspectiva que brinda la simetría, lo que distingue a una teoría posible de otra es el grupo de transformaciones de coordenadas que mantiene invariante el cuadrado del intervalo entre eventos. 243 Es decir, es lo que en matemática se conoce como difeomorfismo de clase C k. Ver las definiciones de éste y otros conceptos relacionados con las variedades (manifolds), por ejemplo, en E. Previato (Editora) "Dictionary of applied mathematics for engineers and scientists", CRC press, Boca Raton, USA, Ver el diccionario de Ema Previato citado en la nota previa a ésta. 245 Y. Ueno "Axiomatic method and theory of relativity" en L.Henkin, P. Suppes y A. Tarski (Editores) "The axiomatic method", North-Holland, Amsterdam, 1959, pp

278 Las transformaciones que resultan admisibles dependen a su vez de las funciones g ik (x 0, x 1, x 2, x 3 ) que caracterizan el campo de componentes del tensor métrico. Si las leyes físicas se formulan de modo tal que su forma no cambie bajo las transformaciones admisibles, serán las mismas para todos los observadores equivalentes: precisamente por eso son equivalentes. Tenemos entonces un principio general de covariancia, pero que por sí mismo no basta para construir una teoría física. Este conjunto de suposiciones, tal como las hemos ido formulando, se podrían aplicar a la mecánica clásica tanto como a la relativista, e inclusive a otras teorías físicas posibles. Resulta muy interesante que si a lo supuesto hasta este momento se añade un nuevo postulado que vincula dos observadores equivalentes en movimiento radial uno respecto de otro, estableciendo que si un observador detecta un evento en la línea recta que lo une a un segundo observador, entonces este último detecta el evento sobre la línea recta que lo une al primer observador, independientemente de los instantes de tiempo que cada observador asigne al evento en cuestión, entonces es posible demostrar que las transformaciones que vinculan las coordenadas de tiempo y espacio de ese evento respecto de uno y otro observador se reducen a tres casos posibles 246 : las transformaciones de Lorentz las transformaciones de Galileo y las transformaciones K de Takeno. Estas últimas se relacionan con la expansión del universo y el principio cosmológico perfecto visto en Retomemos ahora el camino histórico para analizar otros aspectos de la estructura lógica de la física relativista Relatividad restringida El principio de relatividad entendido como postulado que afirma que las leyes de la naturaleza son las mismas respectos a todos los marcos de referencia inerciales implica que una ecuación que describe una ley de la naturaleza posee la misma forma cuando se la expresa en términos de las coordenadas de tiempo y espacio correspondientes al mismo evento observado desde diferentes marcos inerciales. Como vimos en 6.2, combinando este postulado con el postulado que afirma que la velocidad de la luz es la misma respecto de todos los marcos inerciales, y empleando los postulados de simetría que afirman la homogeneidad del tiempo y la homogeneidad e isotropía del espacio, se puede demostrar la invariancia de la expresión del intervalo entre dos eventos al pasar de un marco inercial a otro. A partir de la invariancia del intervalo se pueden deducir las transformaciones de Lorentz para conectar las coordenadas de tiempo y espacio de un mismo evento respecto de dos marcos de referencia inerciales, ya sea como se hizo en 6.2 trabajando con rotaciones en un espacio tetra-dimensional, ya sea con una deducción más general como, por ejemplo, la presentada por Patrick Suppes 247 Más aún, en 6.3 vimos que: 246 Y. Ueno y H. Takeno "On equivalent observers", Progress in Theoretical Physics, vol. 8, 1952, pp P. Suppes "Axioms for relativistic kinematics with and without parity", en L.Henkin, P. Suppes y Tarski (Editores) "The axiomatic method', North-Holland, Amsterdam, 1959, pp

279 (a) Es posible prescindir del postulado de constancia de la velocidad de la luz y del intercambio de señales electromagnéticas para definir el sincronismo entre relojes ubicados en puntos diferentes de un mismo marco inercial (usando señales de naturaleza física diversa o transportando a puntos diferentes en forma cuasi-estática relojes sincronizados en un mismo punto). (b) A partir del principio de relatividad enunciado por Poincaré de las simetrías asumidas del tiempo y del espacio, y de la conservación de las relaciones causales entre eventos al cambiar de marco de referencia, se pueden deducir las transformaciones de Lorentz con una constante de estructura del tiempo-espacio en lugar de la velocidad de la luz. La invalidez de la ley de adición de velocidades de Galileo resultó fundamental para la deducción de las transformaciones de Lorentz efectuada en 6.3, incluyendo el paso intermedio durante el cual se demuestra la existencia de una velocidad invariante. Pero mientras que la constancia de la velocidad de la luz se comprueba siempre a menos de un error experimental, la no aplicabilidad de la ley clásica de adición de velocidades se desprende como conclusión definitiva a partir de los resultados experimentales obtenidos en aceleradores de partículas. Por este motivo la deducción de las transformaciones de Lorentz (y por ende, de la relatividad de la simultaneidad) sin necesidad de postular la constancia de la velocidad de la luz además de ser más general, posee una fundamentación experimental más firme. Es importante destacar que el espacio de cada observador en la teoría restringida de la relatividad es un espacio euclidiano, infinito y plano 249, mientras que el tiempo se representa por un continuo unidimensional equivalente a una recta. Entonces las propiedades de simetría (homogeneidad e isotropía) poseen un carácter global, al igual que las simetrías en el tiempo-espacio de Minkowski asociadas con las transformaciones de Lorentz. Este carácter global de las simetrías, que Wigner denominaba simetrías geométricas, desaparece en la teoría generalizada, siendo sustituido por simetrías locales. Como estas simetrías locales describen ciertas interacciones específicas (la gravitatoria en el caso de la teoría generalizada de la relatividad) se denominan simetrías dinámicas. La condición de invariancia bajo transformaciones de Lorentz junto el requisito de que se obtenga las ecuaciones de la mecánica newtoniana de partículas como caso límite correspondiente a movimientos con velocidades muy pequeñas respecto de la velocidad de la luz permite plantear las ecuaciones de la mecánica relativista de partículas. Las ecuaciones de la electrodinámica ya están formuladas en forma compatible con la teoría restringida de la relatividad, y el ajuste final se obtiene estableciendo las fórmulas de transformación del campo electromagnético cuando se pasa de un marco de referencia inercial a otro. Otro enfoque posible es postular un principio de extremo que generaliza el principio de Hamilton de la mínima acción, originalmente planteado en el marco de la mecánica analítica clásica, y utilizar consideraciones de simetría para deducir la función de 249 Mientras no exista un campo gravitatorio, se puede utilizar como marco espacial cualquier conjunto de cuerpos cuyas distancias mutuas se mantengan constantes, es decir, que se encuentren en reposo relativo. En principio se puede pensar en añadir nuevos cuerpos, cada vez más alejados respecto del conjunto original, pero en reposo respecto de éste. 279

280 Lagrange (Lagrangiana) que aparece en el principio generalizado, primero para una partícula libre y después para una partícula cargada situada en un campo electromagnético 249. La formulación relativista del principio de Hamilton se extiende sin inconvenientes a un sistema de partículas en un campo electromagnético dado. Luego se puede extender hasta reformular la teoría relativista de campos sobre la base de un principio de extremo y una Lagrangiana adecuadamente construida, cuyo dominio está incluido en el espacio de Minkowski Relatividad generalizada: la teoría de la gravitación. Los campos de fuerza presentes en el espacio absoluto de Newton y en el tiempoespacio de Minkowski le dicen a la materia como moverse, pero los cambios de configuración de la materia, que son capaces de afectar a los campos, no tienen efecto alguno sobre esos espacios. Por el contrario el tiempo-espacio de la teoría generalizada determina el movimiento gravitatorio de la materia y es determinado a su vez por el movimiento de la materia, de origen gravitatorio o extra-gravitatorio. El campo gravitatorio emana de toda materia, incluyendo tanto a las partículas como a las ondas electromagnéticas, y emana de sí mismo en forma de ondas de gravitación. Un nuevo principio de simetría, el principio general de covariancia se halla en la base de esta teoría generalizada. Este principio de simetría, de naturaleza local, permite añadir observadores con marcos de referencia no inerciales al conjunto formado por observadores equivalentes. Pero ahora, a diferencia de lo que ocurre en la teoría restringida, el marco de referencia de tiempo y de espacio de los observadores inerciales posee un carácter exclusivamente local 250. Desde el punto de vista matemático, ese carácter local viene representado por un espacio plano de Minkowski que es tangente en cada punto de la variedad curvada formada por todos los eventos físicos posibles. Si consideramos que la variedad curvada se encuentra embebida en un espacio euclidiano de dimensión 10 (como vimos que tiene que ser el caso a partir de las consideraciones efectuadas en 9.4.5), el espacio de Minkowski tangente se aparta progresivamente de dicha variedad a medida que nos alejamos del punto de tangencia. 249 Sobre este punto en particular, ver por ejemplo el artículo de R. Suárez-Ántola, "La aproximación variacional a la teoría de la relatividad: aspectos históricos y epistemológicos", Pensamiento Universitario, N 7, UCU, 2006, pp ISSN Los principios de extremo en física teórica en general, incluyendo el principio de Hamilton extendido a la física relativista, pueden estudiarse en el libro de J.L. Basdevant "Variational principles in Physics", Springer Verlag, New York, La presencia de un campo gravitatorio, en principio variable en el tiempo, modifica la distancia entre los cuerpos. Como consecuencia, a diferencia de lo que ocurre en la teoría restringida, en la teoría generalizada no se puede utilizar como marco de referencia espacial un conjunto de cuerpos en reposo relativo, tan distantes unos de otros como se quiera. La localización espacial en la teoría generalizada debe hacerse en un entorno de un cuerpo y en principio se precisaría un conjunto de cuerpos que llene la totalidad del espacio. A cada cuerpo le correspondería un reloj cuya marcha se vería influida por el campo gravitatorio local. Esta situación dista de ser trivial y a propósito de ella se plantean numerosos problemas. 280

281 Desde la perspectiva suministrada por la teoría generalizada, los puntos de la variedad tiempo-espacio no poseen realidad independiente del valor, no nulo, del tensor métrico asignado a cada punto: el tiempo-espacio es real cuando y solo cuando hay campos. Las coordenadas son simplemente rótulos para identificar eventos físicos. Lo que existe objetivamente es el tiempo-espacio-materia 251. Entonces, para formular una teoría completa es suficiente determinar las componentes del tensor métrico en cada punto de la variedad tetra-dimensional. Las ecuaciones del campo gravitatorio de la teoría generalizada buscan determinarlas. Como son ecuaciones a derivadas parciales, solo se pueden resolver si se introducen condiciones en la frontera adecuadas. Eso fue lo que hizo Karl Schwarzschild cuando construyó su famosa solución de las ecuaciones de la gravitación para el caso de una masa puntual rodeada de vacío: supuso que al alejarnos de la masa, la curvatura del tiempo-espacio tiende a cero y se aproxima cada vez más a un tiempo-espacio de Minkowski. Si la situación física no es estacionaria, es necesario especificar, además, las condiciones iniciales correspondientes. Es importante señalar que las ecuaciones del campo no necesitan determinar el tensor métrico unívocamente, solamente deben determinar unívocamente cosas como las intersecciones de líneas de universo, las denominadas coincidencias puntuales 252. Todas nuestras mediciones eventualmente consisten en observaciones de coincidencias puntuales, del tipo de la coincidencia de la aguja de un instrumento con una marca preestablecida en una escala. En un mismo punto del espacio y en un mismo instante de tiempo se cruzan dos líneas de universo: la de la aguja y la de la escala. En general, se denominan coincidencias puntuales las intersecciones de líneas de universo, es decir, los cruces entre trayectorias de cuerpos en el tiempo espacio-materia. Todas esas coincidencias puntuales son objetivas, independientes del observador. Eso se debe a que son relaciones topológicas, en el sentido siguiente: son preservadas bajo cambios arbitrarios de coordenadas, siempre que sean biunívocos y regulares, y conserven las conexiones causales entre eventos. Cabe esperar que la formulación matemática de las leyes físicas adopte una forma invariante frente a esos cambios de coordenadas: las ecuaciones que las expresan se dice que son covariantes. El asignar un rol fundamental a las coincidencias puntuales en la teoría generalizada fue al parecer una sugerencia de Michele Besso (amigo y ex-compañero de estudios universitarios de Einstein), realizada a Einstein durante una conversación que mantuvieron en agosto de Si el movimiento se pudiera referir al tiempo-espacio-materia como un todo, no se habría eliminado del todo el concepto de movimiento absoluto. 252 El énfasis en las coincidencias puntuales permite eludir la presencia de un exceso de estructura matemática en la teoría generalizada, exceso que al parecer no tiene correlato físico. Este exceso se relaciona con el denominado argumento del agujero, planteado por Einstein en 1913, durante su búsqueda desesperada de las ecuaciones de la teoría generalizada. Ver el artículo de 27 páginas debido a J. Norton: "The hole argument", en The Stanford Encyclopedia of Philosophy. Revisado en

282 Einstein en un principio la rechazó, para terminar aceptándola dos años después, luego de la publicación de un trabajo de Kretschmann (un profesor de física de enseñanza secundaria) en el cual se introducía el concepto (aunque no la denominación) de coincidencia puntual: "No es necesario que las g M, v mismas sean determinadas unívocamente, solo deben serlo los fenómenos observables en el espacio de gravitación, es decir, el movimiento de un punto material debe serlo." 253 A partir de ese momento, Einstein aceptó que toda nuestra experiencia física se reduce, en última instancia, a este tipo de coincidencias puntuales. Reformuladas en el espíritu del Programa de Erlangen de Félix Klein, el grupo de transformaciones puntuales generales en el tiempo-espacio-materia preserva el conjunto de coincidencias puntuales, que se supone agotan el contenido esencial de las geometrías permitidas por la teoría generalizada de la relatividad. Este tipo de transformaciones preserva la diferencia entre geodésicas y no geodésicas. Entonces es posible definir un Principio de Relatividad Generalizada: las leyes de la naturaleza son meramente enunciados acerca de coincidencias puntuales; la única forma natural de expresarlas es por lo tanto en términos de ecuaciones generales covariantes Cosmología relativista Es importante insistir en que la teoría generalizada de la relatividad es una teoría local, lo mismo que son locales las situaciones observacionales o experimentales que condujeron a mediciones confirmatorias, como la rotación del perihelio de mercurio, la curvatura de los rayos luminosos por efecto de la masa del sol, el corrimiento al rojo y el retardo de los pulsos de radar debidos a un campo gravitatorio. Todo ello referido a nuestro rincón del Universo. Un modelo de Universo, o si se quiere, más modestamente, un modelo de Metagalaxia, se puede basar en la teoría generalizada de la relatividad pero siempre implica algo más: el principio cosmológico, las simetrías que se desprenden de este principio, el aporte de las demás ramas de la física y algunas suposiciones adicionales sobre las que muchas veces no se insiste lo suficiente. Una de estas suposiciones se refiere a lo que se considera propiamente "Universo". Desde el punto de vista de la física relativista, todos los eventos contenidos en el cono de luz pasado de un observador, y por tanto que podrían presentar relaciones causales con el estado presente del observador, parece que deberían incluirse en su Universo. Si se le añade todos los eventos que han sufrido o pudieron haber sufrido una influencia causal de parte del observador, se tiene un conjunto de eventos máximo físicamente relacionado con el observador en cuestión: sería su Universo desde el punto de vista de las conexiones causales. Pero también se puede considerar Universo al conjunto de eventos máximo al que se le pueden aplicar las leyes físicas, necesariamente extrapoladas desde nuestro rincón en el cual observamos, experimentamos y construimos teorías. En esta acepción, el Universo de un observador podría incluir eventos que forzosamente no pueden estar causalmente relacionados con dicho 253 Ver J. Norton: "The hole argument", en The Stanford Encyclopedia of Philosophy,

283 observador, y podría excluir eventos que se encuentran sometidos a leyes que no se obtendrían como meras extrapolaciones de nuestras leyes de la física. Una segunda suposición se refiere a la unicidad del Universo, que impide distinguir los aspectos esenciales de los accidentales en los fenómenos, de la forma en que esta distinción se lleva a cabo en las ciencias naturales: precisamente, comparándolos con otros fenómenos similares. Como en cosmología esta comparación es imposible (no se dispone de un conjunto de Universos para observar y eventualmente experimentar) el método inductivo no tiene aplicación. La imposibilidad de aplicar el método inductivo hace que la cosmología no pueda ser precisamente una ciencia natural en el mismo sentido en que lo son la física, la química o la biología. En todo caso, como veremos luego, la cosmología física no presenta una frontera que la separe de la filosofía y de la matemática en forma tan nítida como la que parece separar a estas ciencias naturales. Dejemos este problema de lado para considerar qué se ha hecho para eludir la imposibilidad de aplicar el método inductivo. En su lugar se han utilizado dos métodos, que no solo no se excluyen entre sí, sino que de hecho se combinan siempre en alguna medida Dos métodos para responder al problema de la unicidad del Universo. El primero de los dos métodos mencionados consiste en extrapolar nuestras leyes físicas en gran escala y construir modelos de universos posibles, intentando determinar el que mejor se ajusta a la evidencia empírica disponible. El prototipo de este enfoque es la construcción de modelos cosmológicos a partir de hallar el factor de escala de la métrica Friedmann-Lemaitre-Robertson-Walker utilizando las ecuaciones relativistas para el campo gravitatorio 254 y su ampliación a la teoría del Big Bang. Se trata de una respuesta al problema de la unicidad que surge desde el centro mismo de las ciencias físicas. Como dice Bondi 255, el asunto de cuál es el modelo que mejor se ajusta a las observaciones pasa a ser casi un asunto secundario: la Metagalaxia es considerada como un banco de prueba de las leyes físicas. Este punto de vista es el que mejor refleja lo que se hace en la cosmología física contemporánea. Una variante de este enfoque, que desde hace un tiempo ha adquirido cierta notoriedad, consiste en imaginar mundos posibles donde ciertas constantes de la naturaleza (tales como c, h y G) cuyo valor se conoce a partir de datos experimentales, adoptarían valores diferentes a los conocidos. Luego se intenta analizar las evoluciones de esos mundos, comparándola con la historia tal como la cuenta la teoría del Big Bang. Las conclusiones que han desencadenado más controversia entre científicos, filósofos y teólogos, fuera del ámbito de la cosmología física propiamente dicha, son las que se relacionan con la mayor o menor verosimilitud de aparición y evolución de la vida, en 254 No obstante, en 1934 Milne y Mc Crea mostraron que la mayor parte de los resultados de la cosmología relativista, incluyendo la constante cosmológica, se pueden obtener a partir de una cosmología newtoniana. Ver, por ejemplo, el capítulo 11 del libro de H. Bondi "Cosmology', Dover, New York, 2010, o el capítulo 3 del libro de A. Liddle "An introduction to modern cosmology", Wiley, New York, H. Bondi "Cosmology", capítulo 1, Dover, New York,

284 uno de esos mundos y en el nuestro, según sean los valores asumidos para las constantes de la naturaleza 256. El segundo método parte de constatar que las leyes de la física presuponen ciertas propiedades del tiempo y el espacio, que se piensa deben verificarse en gran escala. Se toman como axiomas, se formulan matemáticamente y se procede a deducir consecuencias, añadiendo aquí y allá algunas otras suposiciones complementarias, pero intentando mantener la coherencia lógica del sistema que se construye, e introducir el menor número de postulados que sea posible. Luego se comparan las consecuencias con las leyes obtenidas por los físicos experimentales, empleando las reglas de correspondencia entre los símbolos de la teoría y las magnitudes de la experiencia. Se trata de una respuesta al problema de la unicidad que surge desde la frontera entre la física y la filosofía. Considera la cosmología física como una disciplina central a partir de la cual se pueden eventualmente obtener nuestras leyes físicas terrestres. Hasta que las leyes de la física experimental permitan una confirmación o fuercen a una rectificación, ese universo al que el modelo matemático se refiere no es el real, sino uno puramente imaginario. Y no solo se puede, sino que se debe intentar construir otros sistemas axiomáticos, otros mundos imaginarios, partiendo de otros supuestos y eventualmente, otras reglas de correspondencia. En lugar de establecer conjeturas sobre las leyes de la naturaleza a partir de numerosas y variadas observaciones, se intenta llegar a dichas leyes por la vía de la deducción: las observaciones se limitan a confirmar o refutar el resultado obtenido. La siguiente opinión de Eddington 257 resume muy bien esta perspectiva, cuando es llevada al extremo: "En todo el sistema de las leyes físicas no hay ninguna que no pueda ser inequívocamente deducida de consideraciones epistemológicas. Una inteligencia que no supiese nada de nuestro universo, pero que supiese cuál es el sistema intelectual mediante el cual la mente humana se interpreta a sí misma el contenido de su experiencia sensible, sería capaz de adquirir todo el conocimiento físico que nosotros hemos adquirido mediante experimentos." El prototipo de este enfoque, actualmente muy desacreditado, es la cosmología de Milne 258. No obstante ese descrédito, es conveniente recordar que, tanto las ciencias físicas como la cosmología física contemporáneas, al igual que todas las ciencias desde sus inicios en la antigüedad clásica, se basan en ciertos presupuestos metafísicos o epistemológicos, que generalmente no son explicitados. Por ejemplo, el postulado de fidelidad de la naturaleza (asumir que de un momento a otro una manzana no se puede transformar sin más en un chimpancé), el postulado de simplicidad (asumir que, pese a las apariencias, la estructura del mundo físico ha de ser 256 Ver, por ejemplo, el libro de J. Barrow "Las constantes de la naturaleza", Crítica, Barcelona, Ver en particular la nota de A. Eddington "Physical science and philosophy", Nature, Supplement 139, 1937, pp , donde explica que las leyes físico-matemáticas de la naturaleza no expresan conocimientos sobre un universo objetivo. El aspecto objetivo de nuestro conocimiento reside, según Eddington, en los detalles de eventos y sistemas particulares obtenidos a través de observaciones. 258 H. Bondi "Cosmology", capítulo 10, Dover, New York,

285 simple, y actuar en consecuencia) o el de economía de pensamiento (trabajar con un mínimo de suposiciones independientes consistentes con una descripción mínima del objeto de estudio). La revolución científica que se produjo al final del renacimiento y al comienzo mismo de la época moderna, no consistió tanto en unajerarquización del abordaje experimental de las ciencias en sí mismo, como en una nueva forma de abordar el diseño, la ejecución y la interpretación de los experimentos que hace de la ciencia un ejercicio controlado de la imaginación y no una mera consecuencia de la observación. Los experimentos de Galileo con el plano inclinado con el propósito de investigar la ley de caída de los cuerpos constituyen un ejemplo paradigmático. La física experimental actual ha continuado, desarrollado y perfeccionado esta forma de abordar el experimento, pero no la ha modificado en lo que le es esencial Tiempo cósmico, espacio cósmico, marcos inerciales y modelos cosmológicos. Dicho esto, enfoquemos la atención sobre el modelo estándar de la cosmología física actual. Su expresión matemática resulta de una selección efectuada en la clase infinita de soluciones de las ecuaciones relativistas para el campo gravitatorio, en base a suponer, no solamente que esas ecuaciones son aplicables en todas partes y en regiones de tiempo-espacio de dimensiones tan grandes como se quiera, sino admitiendo el principio cosmológico en su forma débil y el postulado de Weyl. Pero ni el principio cosmológico ni el postulado de Weyl son parte de la teoría generalizada de la relatividad. Son suposiciones adicionales, independientes de la teoría de la gravitación, pero con dos consecuencias cruciales para la construcción de modelos matemáticos en cosmología: la posibilidad de introducir un fluido cósmico homogéneo e isótropo para expresar el tensor de energía-impulsión, y la posibilidad de utilizar la métrica de Friedmann- Lemaitre-Robertson-Walker para restringir la enorme variedad de posibles tensores métricos que podrían ser soluciones de las ecuaciones del campo gravitatorio. Los marcos de referencia en co-movimiento con el fluido cósmico se pueden considerar como marcos inerciales locales: 1 a posibilidad de identificar un marco inercial queda fundamentada en un modelo cosmológico. Consideremos un cuerpo como la Tierra, en movimiento acelerado respecto del correspondiente marco inercial local. Supongamos que un experimento mecánico se realiza en un laboratorio fijo al suelo, se efectúa con instrumentos que poseen una cierta apreciación, y dura un intervalo de tiempo que es lo bastante pequeño como para que el cambio en la velocidad de la Tierra durante ese intervalo pueda despreciarse al interpretar los resultados de las mediciones. En ese caso, para los fines del experimento nuestro planeta puede considerarse como un sistema inercial (piénsese en un péndulo común). Si se estudian movimientos de mayor duración y en otras condiciones, esta suposición pueda ser claramente inadecuada (piénsese en un péndulo de Foucault). Como vimos en , resulta posible sincronizar los relojes de todos los observadores fundamentales (en co-movimiento con el fluido cósmico) e introducir así un único 259 Sobre el significado de los experimentos de Galileo y sus continuadores, desde una perspectiva filosófica, se puede consultar el trabajo de J. Ortega y Gasset "La filosofía de la historia de Hegel y la historiología", en "Goethe desde dentro", Obras Completas, tomo IV, Revista de Occidente, Madrid,

286 tiempo cósmico y un único espacio físico tridimensional formado por todos los eventos simultáneos respecto de ese tiempo universal. Si bien con un significado muy diferente al que tenían en física pre-relativista (puesto que resultan de una partición, posible pero muy especial, del tiempo-espacio-materia) nos encontramos finalmente con un único tiempo y un único espacio, y con la posibilidad de narrar en este marco una historia del mundo. No obstante, las ecuaciones de la teoría relativista de la gravitación, el principio cosmológico y el postulado de Weyl por sí mismos son compatibles con muchos modelos de Universo diferentes. Cada uno de ellos corresponde a una de las tantas soluciones de las ecuaciones del campo, dependiendo de la densidad de materia-energía y su comportamiento físico. (Figura 14.1) Acelerando.sr*pc COST" co Figura 14.1 Esquema cualitativo que sugiere distintas evoluciones posibles de la distancia promedio entre las galaxias compatible con las ecuaciones del campo gravitatorio de la teoría generalizada. La primera posibilidad en ser estudiada fue el modelo de Universo estático, que podríamos denominar de Parménides, esférico, de volumen finito, cerrado sobre sí mismo, de radio constante y eterno. Fue propuesto por Einstein en 1917, acorde con su ideal de inteligibilidad y su convicción profunda acerca de la naturaleza ilusoria del tiempo 260. Pero a partir de los trabajos de de Sitter (en 1917), Friedmann (en 1922 y 1924) y Lemaítre (en 1927), se propusieron diversos modelos de Universos dinámicos que se expanden, que se contraen o que oscilan para siempre En una carta dirigida al hijo y a la hermana de su mejor amigo y ex-compañero de estudios, Michel Besso, con motivo de su fallecimiento, escribió, tal vez como consuelo para ellos y también para sí mismo: "Para nosotros, físicos convencidos, la distinción entre el presente, el pasado y el futuro, es una ilusión, aún cuando sea obstinada". 261 Una presentación amena de estos primeros modelos matemáticos puede hallarse en el libro de Paul Couderc, "2he expansión of the Universe", Mc Millan, New York,

287 El tiempo en todos estos modelos cosmológicos puede ser considerado como reversible, en la medida en que las ecuaciones correspondientes se mantienen invariantes si se sustituye t por -t. La expansión sostenida e indefinida que predice el modelo estándar, junto con la disminución de la temperatura del Universo a medida que aumenta el factor de escala, conecta el modelo con la termodinámica y sugiere algún tipo de flecha del tiempo. Pero esa flecha es, por así decirlo, puramente geométrica, externa y no termodinámica, porque la expansión que describe el modelo es adiabática 262 (conserva la entropía del Universo). Aún admitiendo el tipo de modelo matemático que resulta de ese enfoque del problema cosmológico, decidir en forma concluyente sobre si el modelo más adecuado es el esférico con un volumen finito aunque muy grande, o es el hiperbólico con volumen infinito y una curvatura muy pequeña, o inclusive si es el modelo plano, actualmente el favorito de la mayoría de los cosmólogos, es muy difícil debido a lo limitado del conocimiento empírico del Universo. Cuando los criterios que deberían hacer posible la elección se confrontan con las observaciones se obtienen valores tan próximos al valor crítico correspondiente al modelo plano, que al parecer haría falta siglos o milenios de acumulación de datos para, con suerte, si el modelo más adecuado no fuera plano, obtener resultados concluyentes a favor de una de las otras dos alternativas. Además, de acuerdo con el modelo estándar, el tiempo-espacio-materia se podría expandir tan rápido que la luz de astros lo bastante lejanos no nos podría alcanzar y entonces no la podríamos medir, no importa lo avanzados que pudieran llegar a ser nuestros instrumentos. Esto complica todavía más la solución al problema de la finitud o infinitud del Universo. En cuanto al problema que podríamos denominar problema de la forma del Universo, involucra tanto propiedades topológicas como métricas, y presenta dificultades aún mayores que el problema de la finitud o infinitud En el capítulo 3 del libro de A. Liddle "An introduction to modern cosmology', Wiley, New York, 2008, se puede encontrar una deducción muy clara y simple de las ecuaciones de Friedmann- Lemaítre involucrando como paso intermedio a la denominada ecuación del fluido cósmico. Se llega a la ecuación del fluido empleando la forma conjunta de la primera y segunda ley de la termodinámica y suponiendo un proceso adiabático y reversible para la totalidad del Universo. El modelo de Universo que se expande en estado estacionario debido a Bondi, Gold y Hoyle, se basa en la creación irreversible de materia, posee una flecha del tiempo pero no posee edad. Hace 20 años Prigogine y algunos de los integrantes de su escuela propusieron un modelo con edad y flecha del tiempo, basado en una extensión de la termodinámica de procesos irreversibles a la descripción de los procesos en el cosmos. Ver los capítulos 7 y 8 del libro de I. Prigogine e I. Stengers "Entre el tiempo y la eternidad', Alianza, Madrid, Este problema de la forma del Universo ha conducido a especulaciones como las denominadas teorías de los multiversos según las cuales nuestro Universo es uno más dentro de un conjunto de mundos que por hipótesis no pueden interactuar entre sí. Un símil terrestre sería un conjunto de pompas de jabón, flotando alejadas unas de otras. Ver G. Ellis, U. Kirchner y W. Stoeger "Multiverses and physical cosmology", Monthly notices of the Royal Astronomical Society, vol. 347, 2004, pp

288 Admitiendo el modelo plano A-CDM, para que este modelo resulte aplicable luego de algunos segundos después del Big Bang, el estado inicial del espacio físico debe de haber sido casi plano 264. Para resolver este problema (entre otros, ya comentados en 12.5), es que se introdujo el proceso inflacionario del Universo. Pero con esta idea aparecen nuevas dificultades: resulta que las energías involucradas en la inflación deben haber sido tan elevadas que quedan por fuera de lo que es esperable alcanzar por la vía experimental en un laboratorio en la Tierra (se necesitaría un acelerador circular de varios años luz de diámetro), de modo que al parecer no se podría confirmar experimentalmente. Además, si el espacio físico es plano e ilimitado, por extensa que sea la región observable del cosmos, el cociente entre el volumen de esa región accesible a la observación y el volumen del Universo siempre va a ser cero. Esto constituye un serio problema cuando se pretende justificar el principio cosmológico débil en las observaciones que nos es dado realizar. Así pues, vemos que la línea de demarcación entre los dos tipos de respuesta al problema cosmológico, el proveniente del centro mismo de las ciencias físicas y el proveniente de la frontera entre la ciencia y la filosofía, se ha borrado un tanto. 264 Ver, por ejemplo, el libro de D. Ivanenko y G. Sardanashvili "Gravitación", capítulo 2, URSS, Moscú,

289 15. Perspectivas psicológicas y sociales "...creo, con Schopenhauer que una de las razones más poderosas que impulsan al hombre hacia el arte y la ciencia es una huida de la rutina cotidiana, con su torpeza dolorosa y su yermo desconsuelo, es cortar el lazo de nuestros deseos siempre cambiantes. Es el intento de afinar las cuerdas de su existencia personal saliendo al mundo de la observación y la comprensión objetivas. El hombre procura formarse una imagen adecuada y fácilmente aprehensible del mundo, con el fin de sobreponerla a la experiencia de la realidad, sustituyéndola hasta cierto grado por ella. Esto es lo que hacen, cada uno a su modo, el pintor, el poeta, el filósofo y el investigador de la naturaleza. Hacia esta imagen y su elaboración desplazan lo principal de su vida sensible, buscando asi la paz y la seguridad que no pueden encontrar en el circulo demasiado estrecho de su agitada experiencia personal. " De la conferencia sobre los principios de la investigación que Einstein desarrolló en 1927, ante los miembros de la Sociedad de Físicos Alemanes, durante el homenaje a Max Planck en el día de su 60 cumpleaños. "La negación de la irreversibilidad del tiempo, que fue para Boltzmann una solución desesperada, llegó a ser para la mayoría de los físicos de la generación de Einstein, el símbolo mismo de lo que, para ellos, es la vocación de la física: alcanzar más allá de lo real observable una realidad temporal inteligible. Einstein es quien mejor encarna, sin duda, el ideal que define esta nueva vocación de la física, ideal de un conocimiento que despoja nuestra concepción del mundo de lo que, a sus ojos, solo era la marca de la subjetividad humana. La ambición de ciertas prácticas místicas ha sido siempre la de escapar a las cadenas de la vida, a los tormentos y decepciones de un mundo cambiante y engañoso. En cierto sentido Einstein hizo de esta ambición la vocación misma del físico y, haciendo esto, la tradujo en términos científicos. Los místicos buscaban vivir este mundo como una ilusión; Einstein quiso demostrar que es solo una ilusión, y que la verdad es un Universo transparente e inteligible, purificado de todo lo que afecta a la vida de los hombres, la memoria nostálgica o dolorosa del pasado, el temor o la esperanza del futuro. " I. Prigogine e I. Stengers en "Entre el tiempo y la eternidad", Alianza, Madrid, En los capítulos precedentes revisamos algunos aspectos de la historia de las ideas en torno al principio de relatividad, partiendo de la nuova scienza de Galileo a comienzos de la edad moderna, hasta llegar al modelo actual A-CDM del Universo. Lo que examinamos desde la perspectiva que brindan las ciencias físicas y su método de investigación, puede examinarse ahora desde una perspectiva psicológica y sociocultural. La forma que adoptó la teoría de la relatividad, sobre todo la generalizada, se puede relacionar con ciertas características personales y presupuestos filosóficos de Einstein que revisamos para comenzar. Luego describiremos brevemente la actividad científica y a los científicos desde las perspectivas psicológica y sociológica. Dedicamos una sección especial al reconocimiento público del aporte individual o de los equipos a la investigación. Pasamos luego a tratar la progresiva especialización y las características de los científicos que trabajan durante las etapas apolíneas con paradigmas bien consolidados, 289

Sitemap