Vista previa del material en texto
Astrodinámica
Alberto Abad
© Astrodinámica
© Alberto Abad, 2012
Grupo de Mecánica Espacial
Universidad de Zaragoza
Zaragoza. Spain.
e-mail: abad@unizar.es
web: web: http://gme.unizar.es
ISBN papel: 978-84-686-2857-8
Editor Bubok Publishing S.L.
Impreso en España/Printed in Spain
iii
Para Pili,
Pablo, Cristina,
Cari y Alejo.
iv
Índice general
Prólogo y agradecimientos XI
I Sistemas de referencia en Astrodinámica 1
1 Sistemas de referencia en IR3 3
1.1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 El espacio af́ın IR3: sistemas de referencia . . . . . . . . . . . . . . 4
1.3 Producto escalar: IR3 como espacio eucĺıdeo . . . . . . . . . . . . . 4
1.4 Ángulos y funciones circulares inversas . . . . . . . . . . . . . . . . 5
1.5 Producto vectorial y mixto . . . . . . . . . . . . . . . . . . . . . . 8
1.6 Sistemas de referencia ortonormales . . . . . . . . . . . . . . . . . 9
1.7 Otras propiedades de los distintos productos de vectores . . . . . . 11
1.8 Ángulo orientado entre dos vectores . . . . . . . . . . . . . . . . . 12
1.9 Coordenadas cartesianas y polares . . . . . . . . . . . . . . . . . . 14
1.10 Trigonometŕıa esférica . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.10.1 Fórmulas de Bessel . . . . . . . . . . . . . . . . . . . . . . . 18
1.10.2 Regla del pentágono de Neper . . . . . . . . . . . . . . . . . 20
1.10.3 Analoǵıas de Neper . . . . . . . . . . . . . . . . . . . . . . . 21
1.10.4 Algoritmo para la resolución de triángulos esféricos . . . . . 22
2 Cambios del sistema de referencia: rotaciones 25
2.1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.2 Rotaciones en IR3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.3 Composición de rotaciones . . . . . . . . . . . . . . . . . . . . . . . 28
2.4 Rotación de un vector alrededor de un eje . . . . . . . . . . . . . . 29
2.5 Rotaciones elementales . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.6 Ángulos de Euler . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.7 Rotaciones y cuaternios . . . . . . . . . . . . . . . . . . . . . . . . 33
3 Fundamentos de los sistemas de referencia en el espacio 37
3.1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.2 Sistema de referencia horizontal . . . . . . . . . . . . . . . . . . . . 39
3.3 Sistema de referencia horario . . . . . . . . . . . . . . . . . . . . . 41
v
vi Índice general
3.4 Sistema de referencia ecuatorial . . . . . . . . . . . . . . . . . . . . 42
3.5 Sistema de referencia ecĺıptico . . . . . . . . . . . . . . . . . . . . . 42
3.6 Relación entre los sistemas de referencia espaciales . . . . . . . . . 43
3.7 Sistema de referencia geográfico . . . . . . . . . . . . . . . . . . . . 45
3.8 Sistema de referencia planetográfico . . . . . . . . . . . . . . . . . 50
4 Sistemas de referencia espaciales precisos 53
4.1 Movimientos del polo y del equinoccio . . . . . . . . . . . . . . . . 53
4.2 Sistemas de referencia espaciales precisos . . . . . . . . . . . . . . . 57
4.3 Transformaciones entre sistemas de referencia precisos . . . . . . . 60
4.3.1 Movimiento del polo . . . . . . . . . . . . . . . . . . . . . . 62
4.3.2 Cambios de origen en el ecuador intermedio . . . . . . . . . 64
4.3.3 Precesión . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
4.3.4 Nutación . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
4.3.5 Tratamiento actual de la precesión y nutación . . . . . . . . 68
4.3.6 Desviación entre los sistemas Eo
�o
y S
G
. . . . . . . . . . . . 70
4.3.7 Transformación general de coordenadas . . . . . . . . . . . 71
4.4 Relación de los sistemas precisos con los sistemas idealizados . . . 71
5 Referencia temporal 73
5.1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
5.2 Relojes basados en la rotación terrestre . . . . . . . . . . . . . . . 75
5.2.1 Tiempo sidéreo . . . . . . . . . . . . . . . . . . . . . . . . . 75
5.2.2 Ángulo de rotación terrestre . . . . . . . . . . . . . . . . . . 77
5.2.3 Tiempo solar y tiempo medio . . . . . . . . . . . . . . . . . 77
5.2.4 Tiempo universal . . . . . . . . . . . . . . . . . . . . . . . . 79
5.3 Movimiento orbital de la Tierra: el año . . . . . . . . . . . . . . . 81
5.4 Relación entre el tiempo sidéreo y el tiempo medio . . . . . . . . . 82
5.5 Escalas de tiempo uniforme . . . . . . . . . . . . . . . . . . . . . . 84
5.5.1 Tiempo de efemérides y tiempo atómico internacional . . . 84
5.5.2 Tiempo universal coordinado . . . . . . . . . . . . . . . . . 86
5.5.3 Tiempo de zona y tiempo oficial . . . . . . . . . . . . . . . 88
5.6 Escalas modernas de tiempo . . . . . . . . . . . . . . . . . . . . . . 88
5.7 Tiempos coordenada . . . . . . . . . . . . . . . . . . . . . . . . . . 90
5.8 Calendario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
5.9 Determinación de una época . . . . . . . . . . . . . . . . . . . . . . 91
II Movimiento kepleriano 95
6 Revisión de elementos de dinámica clásica 97
6.1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
6.2 Movimiento de una masa puntual . . . . . . . . . . . . . . . . . . . 97
6.3 Sistemas inerciales y no inerciales . . . . . . . . . . . . . . . . . . 99
6.4 Movimiento de una part́ıcula en su plano . . . . . . . . . . . . . . 101
Índice general vii
6.5 Sistemas dinámicos . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
6.6 Ecuaciones de Lagrange y de Hamilton . . . . . . . . . . . . . . . . 104
6.7 Transformaciones canónicas . . . . . . . . . . . . . . . . . . . . . . 105
6.8 Ecuación de Hamilton–Jacobi y ecuación de Delaunay . . . . . . . 107
7 Movimiento kepleriano 109
7.1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
7.2 Leyes de Kepler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
7.3 Propiedades de las cónicas . . . . . . . . . . . . . . . . . . . . . . . 110
7.3.1 Elipses: 0 e < 1 . . . . . . . . . . . . . . . . . . . . . . . . 111
7.3.2 Parábolas: e = 1 . . . . . . . . . . . . . . . . . . . . . . . . 112
7.3.3 Hipérbolas: e > 1 . . . . . . . . . . . . . . . . . . . . . . . . 112
7.4 Ley de gravitación de Newton . . . . . . . . . . . . . . . . . . . . . 113
7.5 Problema de dos cuerpos . . . . . . . . . . . . . . . . . . . . . . . . 115
7.6 Movimiento relativo o kepleriano . . . . . . . . . . . . . . . . . . . 116
7.7 Funciones f y g de Lagrange . . . . . . . . . . . . . . . . . . . . . 118
8 Integración del problema kepleriano 123
8.1 Modelo orbital kepleriano . . . . . . . . . . . . . . . . . . . . . . . 123
8.2 Primeras integrales . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
8.3 Deducción de la primera y segunda leyes de Kepler . . . . . . . . . 126
8.4 Tercera ley de Kepler: unidades . . . . . . . . . . . . . . . . . . . . 129
8.5 Ley horaria del movimiento . . . . . . . . . . . . . . . . . . . . . . 130
8.5.1 Formulación regularizada del movimiento kepleriano . . . . 131
8.5.2 Caso parabólico . . . . . . . . . . . . . . . . . . . . . . . . . 133
8.5.3 Caso eĺıptico . . . . . . . . . . . . . . . . . . . . . . . . . . 134
8.5.4 Resolución de la ecuación de Kepler . . . . . . . . . . . . . 136
8.5.5 Caso hiperbólico . . . . . . . . . . . . . . . . . . . . . . . . 138
9 Órbitas keplerianas 141
9.1 Caracterización de las órbitas keplerianas . . . . . . . . . . . . . . 141
9.2 Elementos orbitales ordinarios . . . . . . . . . . . . . . . . . . . . . 143
9.3 Variables no singulares . . . . . . . . . . . . . . . . . . . . . . . . . 145
9.4 Sistemas de referencia orbitales . . . . . . . . . . . . . . . . . . . . 146
9.4.1 Sistema espacial . . . . . . . . . . . . . . . . . . . . . . . . 146
9.4.2 Sistema nodal–espacial . . . . . . . . . . . . . . . . . . . . . 147
9.4.3 Sistema nodal . . . . . . . . . . . . . . . . . . . . . . . . . . 147
9.4.4 Sistema apsidal . . . . . . . . . . . . . . . . .. . . . . . . . 149
9.4.5 Sistema orbital . . . . . . . . . . . . . . . . . . . . . . . . . 149
9.4.6 Sistema de Frenet . . . . . . . . . . . . . . . . . . . . . . . 150
9.5 Relaciones entre el vector de estado y los elementos orbitales . . . 151
9.5.1 Determinación de la órbita a partir de las condiciones iniciales152
9.5.2 Cálculo de efemérides . . . . . . . . . . . . . . . . . . . . . 153
9.6 Intersección de dos órbitas keplerianas . . . . . . . . . . . . . . . . 154
9.6.1 Pertenencia de un punto a una órbita . . . . . . . . . . . . 154
viii Índice general
9.6.2 Intersección de órbitas no coplanarias . . . . . . . . . . . . 155
9.6.3 Intersección de órbitas coplanarias . . . . . . . . . . . . . . 155
9.6.4 Colisiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
9.7 Variaciones de los sistemas de referencia . . . . . . . . . . . . . . . 157
9.8 Variables polares–nodales . . . . . . . . . . . . . . . . . . . . . . . 158
9.9 Variables de Delaunay en el movimiento eĺıptico . . . . . . . . . . . 160
10 Formulación universal del problema kepleriano 163
10.1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163
10.2 Funciones V de Stump↵ . . . . . . . . . . . . . . . . . . . . . . . . 163
10.3 Funciones V
0
,V
1
. . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
10.4 Formulación universal del problema kepleriano . . . . . . . . . . . 169
10.5 Coeficientes de transición en forma cerrada . . . . . . . . . . . . . 172
11 Órbitas keplerianas que pasan por dos puntos 175
11.1 Problema de transferencias orbitales y problema de Lambert . . . 175
11.2 Órbitas de transferencia . . . . . . . . . . . . . . . . . . . . . . . . 176
11.2.1 Plano de la órbita . . . . . . . . . . . . . . . . . . . . . . . 177
11.2.2 Ángulo de transferencia . . . . . . . . . . . . . . . . . . . . 177
11.3 Elementos del triángulo OP
1
P
2
. . . . . . . . . . . . . . . . . . . . 177
11.4 Hodógrafa en P
1
y P
2
. . . . . . . . . . . . . . . . . . . . . . . . . 179
11.5 Órbitas de enerǵıa mı́nima . . . . . . . . . . . . . . . . . . . . . . . 182
11.6 Órbitas de enerǵıa h > h
m
. . . . . . . . . . . . . . . . . . . . . . . 182
11.7 Conjunto de las órbitas que pasan por dos puntos . . . . . . . . . . 185
11.8 Tiempo de tránsito . . . . . . . . . . . . . . . . . . . . . . . . . . . 186
11.9 Órbitas keplerianas que pasan por dos puntos en dos instantes . . 187
III Movimiento orbital 189
12 Movimiento orbital 191
12.1 Ecuaciones del movimiento orbital . . . . . . . . . . . . . . . . . . 191
12.2 Ecuaciones de Lagrange . . . . . . . . . . . . . . . . . . . . . . . . 192
12.3 Ecuaciones de Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . 195
12.4 Perturbaciones de corto y largo periodo y seculares . . . . . . . . . 197
12.5 Método de aproximaciones sucesivas . . . . . . . . . . . . . . . . . 198
12.6 Perturbaciones de primer orden en el movimiento orbital . . . . . . 199
12.7 Propagadores orbitales . . . . . . . . . . . . . . . . . . . . . . . . . 200
12.8 Propagador SGP4/SDP4 y variables TLE . . . . . . . . . . . . . . 203
13 Problema de n cuerpos 207
13.1 Formulación del problema de n cuerpos . . . . . . . . . . . . . . . 207
13.2 Modelo planetario . . . . . . . . . . . . . . . . . . . . . . . . . . . 209
13.3 Perturbación luni-solar del satélite artificial . . . . . . . . . . . . . 210
13.4 Problema de tres cuerpos . . . . . . . . . . . . . . . . . . . . . . . 211
13.4.1 Problema restringido . . . . . . . . . . . . . . . . . . . . . . 211
Índice general ix
13.4.2 Problema restringido circular . . . . . . . . . . . . . . . . . 212
13.4.3 Puntos de Lagrange . . . . . . . . . . . . . . . . . . . . . . 213
13.4.4 Curvas de velocidad cero . . . . . . . . . . . . . . . . . . . 216
14 Atracción de sólidos 219
14.1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219
14.2 Polinomios de Legendre . . . . . . . . . . . . . . . . . . . . . . . . 220
14.3 Potencial gravitatorio de un planeta . . . . . . . . . . . . . . . . . 223
14.4 Modelos de potencial gravitatorio . . . . . . . . . . . . . . . . . . . 226
14.5 Evaluación del potencial planetario y la fuerza derivada . . . . . . 228
14.6 Potencial terrestre en variables polares nodales . . . . . . . . . . . 230
14.7 Ecuaciones del movimiento en el sistema planetográfico . . . . . . 231
15 Otras perturbaciones 235
15.1 Rozamiento atmosférico . . . . . . . . . . . . . . . . . . . . . . . . 235
15.2 Presión de radiación solar . . . . . . . . . . . . . . . . . . . . . . . 239
15.3 Eclipses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241
15.3.1 Semidiámetros y distancia angular . . . . . . . . . . . . . . 241
15.3.2 Condiciones para un eclipse . . . . . . . . . . . . . . . . . . 242
15.3.3 Área de un segmento circular . . . . . . . . . . . . . . . . . 243
15.3.4 Magnitud del eclipse . . . . . . . . . . . . . . . . . . . . . . 245
15.3.5 Eclipses en satélites artificiales terrestres . . . . . . . . . . . 246
15.4 Perturbaciones relativistas . . . . . . . . . . . . . . . . . . . . . . . 247
15.5 Perturbaciones emṕıricas . . . . . . . . . . . . . . . . . . . . . . . . 248
IV Navegación espacial 249
16 Navegación espacial 251
16.1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251
16.2 Satélites artificiales terrestres . . . . . . . . . . . . . . . . . . . . . 253
16.2.1 Satélites de comunicaciones . . . . . . . . . . . . . . . . . . 254
16.2.2 Satélites de navegación . . . . . . . . . . . . . . . . . . . . . 255
16.2.3 Satélites de observación terrestre . . . . . . . . . . . . . . . 257
16.2.4 Satélites cient́ıficos . . . . . . . . . . . . . . . . . . . . . . . 258
16.2.5 Estaciones espaciales . . . . . . . . . . . . . . . . . . . . . . 259
16.2.6 Veh́ıculos de transporte de carga . . . . . . . . . . . . . . . 260
16.2.7 Basura espacial . . . . . . . . . . . . . . . . . . . . . . . . . 262
16.3 Navegación interplanetaria . . . . . . . . . . . . . . . . . . . . . . . 263
16.3.1 Viajes a la Luna . . . . . . . . . . . . . . . . . . . . . . . . 264
16.3.2 Viajes a Marte . . . . . . . . . . . . . . . . . . . . . . . . . 266
16.3.3 Exploración del sistema solar . . . . . . . . . . . . . . . . . 267
x Índice general
17 Órbitas de satélites artificiales terrestres 271
17.1 Movimiento del satélite sobre la superficie terrestre . . . . . . . . . 271
17.1.1 La órbita en la superficie terrestre: traza . . . . . . . . . . . 272
17.1.2 Visibilidad de un satélite desde una estación . . . . . . . . . 276
17.2 El problema principal del satélite . . . . . . . . . . . . . . . . . . . 278
17.3 Efectos sobre el satélite de otras perturbaciones . . . . . . . . . . . 279
17.4 Clasificación de los satélites artificiales según su órbita . . . . . . . 281
17.4.1 Órbitas bajas (LEO) . . . . . . . . . . . . . . . . . . . . . . 281
17.4.2 Órbitas medias (MEO) . . . . . . . . . . . . . . . . . . . . 282
17.4.3 Órbitas geoestacionarias (GEO) . . . . . . . . . . . . . . . 282
17.4.4 Satélites Molniya y Tundra . . . . . . . . . . . . . . . . . . 283
17.4.5 Satélites heliośıncronos . . . . . . . . . . . . . . . . . . . . . 284
17.4.6 Órbitas de transferencia geoestacionarias (GTO) . . . . . . 285
18 Maniobras orbitales 287
18.1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287
18.2 La velocidad y la navegación espacial . . . . . . . . . . . . . . . . . 287
18.3 Propulsión de naves espaciales . . . . . . . . . . . . . . . . . . . . . 290
18.4 Lanzamiento de satélites artificiales . . . . . . . . . . . . . . . . . . 295
18.5 Corrección de órbitas . . . . . . . . . . . . . . . . . . . . . . . . . . 301
18.5.1 Corrección general de la órbita . . . . . . . . . . . . . . . . 302
18.5.2 Cambio del plano orbital . . . . . . . . . . . . . . . . . . . 302
18.5.3 Corrección de la órbita en su plano . . . . . . . . . . . . . . 305
18.5.4 Cambio de la forma de laórbita . . . . . . . . . . . . . . . 306
19 Transferencias y encuentros orbitales 309
19.1 Transferencias orbitales . . . . . . . . . . . . . . . . . . . . . . . . 309
19.1.1 Transferencias de Hohmann y bieĺıptica . . . . . . . . . . . 310
19.1.2 Transferencia óptima en dos maniobras . . . . . . . . . . . 314
19.2 Encuentros orbitales . . . . . . . . . . . . . . . . . . . . . . . . . . 315
19.2.1 Maniobra de espera . . . . . . . . . . . . . . . . . . . . . . 316
19.2.2 Encuentro directo en transferencias generales . . . . . . . . 317
19.2.3 Encuentros en transferencias de Hohmann . . . . . . . . . . 318
19.3 Viaje a Marte en una órbita de transferencia de Hohmann . . . . . 321
20 Navegación interplanetaria 323
20.1 Sondas espaciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323
20.2 Esfera gravitacional de influencia . . . . . . . . . . . . . . . . . . . 325
20.3 Salida del campo gravitacional de un planeta . . . . . . . . . . . . 327
20.4 Entrada en el campo gravitacional de un planeta . . . . . . . . . . 329
20.5 Impulso gravitacional . . . . . . . . . . . . . . . . . . . . . . . . . 332
Bibliograf́ıa 335
Índice alfabético 337
Prólogo y agradecimientos
La Tierra es la cuna de la inteligencia,
pero no se puede vivir siempre en una cuna.
Konstantin E. Tsiokovsky, 1911.
La tecnoloǵıa espacial es responsable de una buena parte de los avances tec-
nológicos actuales. La investigación y desarrollo en cuestiones cient́ıficas y técnicas
relativas a los satélites artificiales y la navegación espacial resultan fundamenta-
les para un rápido avance cient́ıfico y tecnológico. Son muchas las actividades
cotidianas que no podŕıamos realizar de no existir satélites artificiales orbitando
alrededor de la Tierra. En efecto, en las noticias de televisión son frecuentes las
conexiones con páıses de otros continentes; recibimos canales de televisión a través
de las antenas parabólicas; hablamos con otros páıses por teléfono con igual o me-
jor cobertura que en la misma ciudad; vemos fotograf́ıas de las borrascas, lo que
permite la predicción del tiempo; sabemos los minutos que faltan hasta que llegue
el próximo autobús; tenemos información de los minutos y segundos que lleva de
ventaja el ciclista escapado sobre el pelotón que lo persigue, etc. Además, hay
otros usos más sofisticados, como el poder obtener imágenes de galaxias extre-
madamente alejadas, hacer un seguimiento del avance de la desertificación en los
Monegros, una estimación de la nieve acumulada en el Pirineo, localización de una
colonia de linces ibéricos, detectar bancos de pesca, o hacer llegar la educación a
lugares remotos, como la selva brasileña, por poner unos cuantos ejemplos. Pero
todas estas posibilidades son relativamente recientes; el primer satélite artificial,
el Sputnik I se lanzó en 1957. La era espacial, en el momento de escribir estas
ĺıneas, no tiene más que 55 años.
Uno de los aspectos fundamentales para el éxito de una misión artificial es el
xii
establecimiento de una órbita precisa que le permita desarrollar, durante el mayor
periodo de tiempo posible, la misión para la que ha sido concebido. Los funda-
mentos del análisis del movimiento orbital de los satélites artificiales, aśı como el
de otras naves espaciales cuyo propósito sea la exploración del espacio exterior,
se basan en las consecuencias de la ley de gravitación universal enunciada por
Newton. Esta ley, que determina el movimiento de cualquier cuerpo en el espacio,
natural o artificial, dio lugar a la Mecánica Celeste, que nació como la disciplina
cient́ıfica que estudia el movimiento de planetas, cometas, asteroides y cualquier
otro cuerpo sometido a la ley de gravitación de Newton.
Las caracteŕısticas especiales de alguno de los problemas dinámicos planteados
en el estudio de las órbitas de los satélites artificiales llevaron a definir una nueva
disciplina cient́ıfica, la Astrodinámica, heredera de la Mecánica Celeste, que estu-
dia principalmente el movimiento en el espacio de los objetos artificiales. Aunque
la causa fundamental del movimiento sigue siendo la ley de gravitación de Newton,
en Astrodinámica hay que considerar otro tipo de fuerzas no gravitacionales que
modifican las consecuencias de esta ley. Por otro lado, la Astrodinámica añade a la
Mecánica Celeste un nuevo problema, como es el diseño de complejas trayectorias
para las naves espaciales que les permitan realizar, con las limitaciones energéticas
actuales, cualquier recorrido por el sistema solar. El presente libro pretende dar
una visión general de los principales puntos que aborda la Astrodinámica, para
ello se ha dividido en cuatro partes: sistemas de referencia, movimiento kepleriano,
movimiento orbital y navegación espacial.
En la primera parte del libro se aborda un problema previo a la navegación
espacial, la determinación precisa de la posición y velocidad de un cuerpo en el
espacio. En primer lugar se realiza un repaso de una serie de herramientas básicas,
que van, desde el concepto de ángulo y vector, hasta el de sistema de referencia y
el estudio de las rotaciones de estos sistemas. Una vez establecidos los conceptos
básicos se pasa al estudio de los sistemas de referencia astronómicos considerando
las variaciones de estos sistemas debidas a los pequeños movimientos de los planos
fundamentales del ecuador y la ecĺıptica. En este punto se han introducido todas
las recomendaciones y normas dictadas por la Unión Astronómica Internacional
(IAU) en el año 2000, y en vigor desde el año 2003, que vienen a modificar las
teoŕıas de la precesión y nutación de los años 1976 y 1980. Finalmente se estudia
el parámetro que actúa de variable independiente en las teoŕıas dinámicas, esto es,
el tiempo. Puesto que cualquier misión espacial establecerá su referencia temporal
a través de un reloj, se estudian los distintos tipos de relojes y tiempos que nos
da la Astronomı́a.
En la segunda parte del libro se estudia en profundidad el movimiento ke-
pleriano. Las leyes de Kepler describen el comportamiento de la solución de un
modelo teórico basado en el movimiento relativo de dos masas puntuales que inter-
accionan gravitacionalmente de acuerdo con la ley de Newton. No solo se integra
el problema, sino que se realiza un estudio cualitativo exhaustivo del mismo, que
es necesario para comprender la complejidad del modelo orbital real. Se analiza
la geometŕıa de este movimiento, aśı como distintos conjuntos de variables que lo
xiii
describen y varios sistemas de referencia asociados a las órbita keplerianas. Final-
mente se estudia el problema de contorno consistente en el análisis del conjunto
de órbitas keplerianas que pasan por dos puntos.
La tercera parte trata del modelo orbital real. Se analizan los distintos efec-
tos que pueden modificar una órbita kepleriana: forma no esférica de la Tierra
y de los planetas; atracción gravitacional de otros cuerpos; frenado atmosférico;
presión de radiación solar; efectos relativistas; etc. Se estudia la formulación del
problema de tres cuerpos, que es el siguiente en complejidad al modelo keple-
riano de dos cuerpos, y se analiza un caso particular, el problema restringido, que
determina muchas de las caracteŕısticas dinámicas de la navegación interplaneta-
ria. Finalmente, se obtienen las ecuaciones que permiten estudiar los modelos de
movimiento orbital a partir de aproximaciones al modelo kepleriano.
La parte final aborda los aspectos que se refieren a la navegación espacial,
tanto de satélites artificiales como de sondas interplanetarias. El primer caṕıtulo
de esta parte analiza la historia del primer medio siglo de navegación espacial,
no tanto desde un punto de vista cronológico, sino describiendo la historia de
cada tipo de misión, procurando dar de esta forma una visión más coherente
de la industria espacial actual. Se estudian por separado los satélites artificiales
y la navegación interplanetaria.En los primeros se analiza la interacción entre
éstos y la Tierra, que condiciona el tipo de misión en función de las zonas de
la Tierra que el satélite sobrevuela. También se estudian los distintos tipos de
maniobras, incluido el lanzamiento, que permiten modificar una órbita; aśı como
las trasferencias orbitales, o conjunto de maniobras que conectan órbitas sin un
punto en común. El último caṕıtulo estudia los conceptos básicos para el diseño
de las trayectorias interplanetarias a partir de la unión de fragmentos de órbitas
keplerianas.
El presente libro ha sido escrito después de muchos años de estar encargado
de la docencia de las asignaturas de Astronomı́a y Mecánica Celeste de la licen-
ciatura de Matemáticas en la Universidad de Zaragoza. Parte de las notas escritas
como consecuencia de dicha docencia se plasmaron en un libro titulado Curso de
Astronomı́a y escrito en colaboración con José Angel Docobo y Antonio Elipe.
A ellos quiero agradecer el uso, en éste libro, de ciertas partes del anterior, con
objeto de dejar cerrados algunos temas. De esta forma, el lector interesado úni-
camente en Astrodinámica no tendrá la necesidad de navegar en otro libro más
orientado a la Astronomı́a.
Con este libro he intentado llenar una laguna en la literatura en español de
temas de Astrodinámica, pues son muy escasos los libros de estas caracteŕısticas
que pueden encontrarse en las libreŕıas. Escribir el libro en español me ha hecho
reflexionar sobre la adaptación de los términos cient́ıficos a nuestra lengua y me
ha conducido a unas consideraciones sobre terminoloǵıa que, equivocadas o no,
he intentado plasmar en el libro. En este punto quiero agradecer a mi colega Luis
Floŕıa sus fruct́ıferas e ilustrativas conversaciones sobre el tema. El inglés se ha
convertido en la lengua común de la ciencia, es por ello corriente que determinados
xiv
términos no se traduzcan o la traducción sea poco meditada. Al escribir este libro
he intentado utilizar una terminoloǵıa que se adapte al máximo a las palabras y
conceptos del español y a su significado cient́ıfico. Esto debe ayudar a realizar una
correcta interpretación de dichos términos cuando se pretende hacer divulgación
de temas especializados a personas no expertas en la materia o no familiarizadas
con la literatura técnica escrita en inglés. Aśı, en este libro he usado palabras no
estándar como cónicas enlazadas en lugar de patched conics, órbitas de aproxima-
ción en lugar de flyby o swingby, etc. Al final de la obra, en el ı́ndice alfabético se
han incorporado algunos de estos términos comunes en inglés con una indicación
de la traducción usada en el libro.
También resulta relacionado con el lenguaje otro aspecto que podŕıa no men-
cionar y dejar pasar desapercibido pero del que prefiero que quede constancia
escrita. Aśı como he intentado ser riguroso en la elección de la terminoloǵıa en
español y por adelantado pido excusas por los posibles fallos cometidos en este
empeño, también he prescindido de una norma de nuestro lenguaje que creo debe
ser modificada. Es norma del español usar la coma como separador de la parte de-
cimal de un número. A este respecto, creo firmemente que el lenguaje matemático,
que es un lenguaje universal, debe estar por encima de cualquier localismo que
únicamente lo dificulta. Aunque es bien cierto que la coma o el punto únicamente
constituyen dos formas diferentes de representación de un mismo concepto, que
es el número real, es también útil disponer de un representación universal que sea
interpretada en la misma forma por cualquier persona. Por ello he optado por el
uso del punto en lugar de la coma como separador decimal.
La escritura de un libro de texto cient́ıfico requiere la realización de profundas
revisiones para garantizar la calidad del producto final. Sin embargo, la experien-
cia me indica que en cada revisión (no profesional) de un texto del tamaño de éste,
siempre se encuentran nuevas erratas. No pienso que este libro quede totalmente
exento de las mismas, por lo que intentaré, dentro de lo posible, informar al lector
de todas las que se vayan encontrando después de la edición definitiva. Para ello
puede consultarse la página web: gme.unizar.es/pages/libroastrodinamica, donde
se informará, periódicamente, de las mismas, aśı como de toda información útil
relacionada con el libro. A lo largo del próximo año aparecerá también, como se
menciona en el caṕıtulo 12, el softwareOrbits, paquete deMathematica que com-
plementa este libro. En la página web: gme.unizar.es/software/orbits, aparecerán
instrucciones sobre su descarga y uso.
Quiero terminar este prólogo entrando en el apartado de agradecimientos. Es
dif́ıcil intentar agradecer en unas pocas ĺıneas a todos cuantos, de alguna forma,
han colaborado, directa o indirectamente, en la escritura de este libro, al fin y al
cabo, la escritura del libro está ı́ntimamente relacionada con una trayectoria pro-
fesional de más de 30 años. Por otro lado, quiero ser breve y no deseo olvidarme
de nadie, aśı que comenzaré con un agradecimiento genérico a todos los miembros
del Grupo de Mecánica Espacial de la Universidad de Zaragoza y a todos los cole-
gas y amigos de las Universidades de La Rioja, Santiago de Compostela, Murcia,
Cartagena, Pamplona y del Real Observatorio de la Armada.
xv
Por otra parte, es de justicia escribir unas lineas aparte, y muy destacadas,
para todos los miembros del grupo APSIDE (Asociación para la Promoción Social
de la Investigación y el Desarrollo Espacial), sección aragonesa del proyecto SSETI
(Student Space Exploration and Technology Initiative) a quienes dedico de manera
especial este libro y que son quienes, de alguna forma, me han creado la obligación
moral de escribirlo, terminarlo e intentar que sea una herramienta útil para todos
aquellos estudiantes interesados en la industria espacial.
El proyecto SSETI nació hace unos años como una iniciativa de la Agencia
Espacial Europea (ESA) para formar a jóvenes estudiantes en el ámbito espacial.
El proyecto pretend́ıa agrupar universidades de toda Europa formando equipos
que seŕıan capaces de diseñar, construir y lanzar satélites. La novedad consist́ıa en
que todo el proyecto estaŕıa dirigido y formado exclusivamente por estudiantes,
contando con el apoyo de expertos de la Agencia y profesores de las universidades.
Como primer objetivo se planteó la construcción y env́ıo al espacio del satélite
ESEO (European Student Earth Orbiter). Itziar Barat y Rubén Castro, estu-
diantes de la Facultad de Ciencias de la Universidad de Zaragoza, asumieron el
liderazgo de un grupo de compañeros de las licenciaturas de Matemáticas y F́ısi-
cas y se encargaron del análisis de misión de ESEO, es decir, el diseño de la órbita
y de todos los aspectos astrodinámicos derivados de la misma. Además conven-
cieron a Antonio Elipe, que fue decano de la Facultad de Ciencias y Director del
Instituto de Matemáticas y Aplicaciones de Aragón, y a mi mismo, para actuar
como profesores tutores del proyecto Los miembros del SSETI han ido cambian-
do, en su mayor parte por terminar sus estudios de licenciatura. A lo largo de
estos años varias generaciones de estudiantes han ido desarrollando sin desánimo
el proyecto. Además de los ya mencionados debo nombrar también a Isaac Toda
y Eva Tresaco en la segunda generación, a Julia Maŕın-Yaseli, David Vicente y
Alejandro Vaquero en la tercera y el último por ahora, Jonatan Peris, que ha
conseguido que la llama de la ilusión no se extinga. No son los únicos y ruego al
resto de sus compañeros que me perdonen y que hagan suyo mi homenaje a todo
el grupo.
La falta de estabilidad de los grupos, que necesariamente deb́ıan cambiar al-
gunos miembros cada año, hicieron ver a los organizadores de la ESA que los
objetivos iniciales de ESEO eran demasiado ambiciosos, por lo que se planteó la
necesidad de desarrollar un proyecto algo menos exigenteque, por su duración,
no desmotivara a los participantes. Aśı nació SSETI-Express, un satélite artificial
más pequeño desarrollado en dos años y lanzado al espacio el d́ıa 27 de Octubre de
2005. Aunque la señal de dicho satélite se perdió por problemas en las bateŕıas,
podemos calificar sus resultados como de profundo éxito. Este éxito animó al
uso de la experiencia adquirida para alcanzar mayores objetivos, como el pro-
yecto ESMO (European Student Moon Orbiter) que trataba de enviar una nave
a orbitar en torno a la Luna. Diversos acontecimientos posteriores, junto con la
crisis económica, minimizaron los objetivos propuestos, aunque afortunadamente
todav́ıa subsiste una pequeña llama encendida, en espera de tiempos mejores.
xvi
Para un profesor nada hay tan importante como el éxito de sus alumnos, en
este caso comprobado y reconocido. Por ello, quiero enviarles a todos ellos mi
agradecimiento más profundo, por ser los culpables de la finalización del libro
y por haber logrado que recuperara la ilusión por la docencia y demostrarme,
y demostrar a muchos otros, que con voluntad y con esfuerzo cualquier joven
preparado es capaz de conseguir lo que se proponga.
Zaragoza, Agosto de 2012
Alberto Abad
Parte I
Sistemas de referencia en
Astrodinámica
1
Caṕıtulo 1
Sistemas de referencia en IR3
1.1 Introducción
El objetivo del presente caṕıtulo es recordar el concepto de sistema de refe-
rencia en IR3, necesario para situar la posición de los astros y otros objetos en el
espacio. Para ello, efectuaremos un breve repaso de las propiedades básicas del
espacio vectorial real IR3 y de todos los conceptos asociados al mismo como los
productos escalar, vectorial y mixto, ángulos, etc., que serán de gran importancia
en el desarrollo del libro.
Estas notas no constituyen un tratado de álgebra, de hecho, será necesaria una
revisión de un libro especializado para una mejor comprensión de algunos de los
conceptos aqúı utilizados. Sin embargo, hemos preferido profundizar en algunos
aspectos, como el de sentido de un ángulo y la orientación de los sistemas de
referencia, pues estos conceptos, de gran importancia en la Astrodinámica, son a
menudo tratados sin demasiado rigor.
La trigonometŕıa esférica ha sido la herramienta tradicional para resolver pro-
blemas de Astronomı́a de Posición, donde el concepto de distancia entre puntos,
imposible de medir por observación directa, es cambiado por el de distancia an-
gular, sustituyendo los puntos de IR3 por su proyección en una esfera de radio
arbitrario (tomado como unidad de longitud). En este libro, salvo en una oca-
sión, hemos utilizado el cálculo vectorial y matricial en lugar de las fórmulas de
la trigonometŕıa esférica, lo que conduce a relaciones más fáciles de entender y
que no contienen ambigüedades. Sin embargo, con objeto de que el lector pueda
comprender algunas de las demostraciones que aparecen en libros clásicos de As-
trodinámica desarrollaremos brevemente en este caṕıtulo los fundamentos de la
4 Sistemas de referencia en IR3
trigonometŕıa esférica.
1.2 El espacio af́ın IR3: sistemas de referencia
El espacio IR3 puede ser considerado como un conjunto de elementos, llamados
puntos, que se representan por letras mayúsculas: O,P,Q, S, . . .; o bien, como el
conjunto de vectores x de un espacio vectorial real de dimensión tres.
Estas dos formas de ver IR3 pueden relacionarse si consideramos un punto
cualquiera O 2 IR3, que llamaremos origen, y asociamos a cada punto P un vector
de IR3, que llamaremos x = OP , y que geométricamente representa el segmento
(vector) que une el punto O con el punto P . Si consideramos otro punto Q, tal
que y = OQ, podremos poner QP = OP � OQ = x � y. De esta forma hemos
dotado a IR3 de una estructura de espacio af́ın.
Si consideramos una base (i
1
, i
2
, i
3
) de IR3 el elemento x 2 IR3 puede repre-
sentarse por tres números reales (x
1
, x
2
, x
3
), que son llamados componentes del
vector en dicha base, de manera que x = x
1
i
1
+ x
2
i
2
+ x
3
i
3
.
Al conjunto formado por el origen y la base {O, i
1
, i
2
, i
3
} le llamaremos sistema
de referencia de IR3. En este sistema de referencia el vector correspondiente al
origen O tiene sus tres componentes nulas.
1.3 Producto escalar: IR3 como espacio eucĺıdeo
Llamaremos producto escalar de dos vectores x,y, al número real
x · y = x
1
y
1
+ x
2
y
2
+ x
3
y
3
, (1.1)
donde (x
1
, x
2
, x
3
), (y
1
, y
2
, y
3
) son las componentes de x,y en la base (i
1
, i
2
, i
3
).
Aunque el valor obtenido con esta definición depende de la base donde estemos
trabajando, puede demostrarse fácilmente que el valor del producto escalar es
independiente de la base en la cual se calcule. El producto escalar nos permi-
tirá definir los conceptos de ángulo y distancia.
Diremos que dos vectores son ortogonales cuando su producto escalar sea cero.
Llamaremos longitud o norma de un vector al escalar
kx k =
p
x · x = (x2)1/2.
De esta forma, la distancia entre dos puntos P,Q vendrá dada por la norma del
vector QP = OP �OQ.
Todo vector x puede ser expresado en la forma
x = kx k x̂,
Ángulos y funciones circulares inversas 5
donde x̂ representa un vector de norma unidad en la misma dirección que x y por
lo cual será llamado dirección. Esta propiedad permite caracterizar un vector por
su norma y su dirección.
El producto escalar de vectores verifica además las siguientes propiedades:
x · y = y · x,
x · (y + z) = x · y + x · z,
(�x) · y = �(x · y),
x · x � 0,
x · x = 0 () x = 0.
(1.2)
La introducción de los conceptos de producto escalar y distancia y sus propie-
dades permiten considerar IR3 como espacio eucĺıdeo.
↵
2⇡ � ↵
x
y
Figura 1.1: Ángulo entre dos vectores.
Llamaremos ángulo entre dos vectores
x,y, al número real ↵ que verifica
x · y = kx kky k cos↵. (1.3)
Las propiedades de la función coseno,
aśı como la propia geometŕıa de la figura
1.1, nos indican la existencia de dos po-
sibles soluciones de la anterior ecuación
que se corresponden con los dos ángulos
↵, 2⇡ � ↵.
1.4 Ángulos y funciones circulares inversas
Observando la figura 1.1 podemos pensar en un ángulo como el arco o trayec-
toria recorrido por el vector x hasta llegar a la dirección ocupada por el vector y.
Para llegar a y puede pasarse varias veces por su posición, lo que equivale a dar
varias vueltas y se corresponde con las propiedades de periodicidad de la función
coseno. Aśı pues, desde el punto de vista de la definición anterior, el ángulo entre
dos vectores o direcciones puede considerarse idéntico si le restamos o sumamos
un número entero de vueltas, esto es, un múltiplo de 2⇡.
Con objeto de evitar esta múltiple definición y precisar más este concepto
definiremos en IR una relación de equivalencia R
2⇡
de la siguiente forma: dados
x, y 2 IR diremos que x está relacionado con y, esto es xR
2⇡
y, si y solo si existe un
k 2 ZZ tal que x� y = 2k⇡. El conjunto A de las clases de equivalencia definidas
por R
2⇡
coincide con el conjunto cociente IR /2⇡ZZ y hereda la estructura de grupo
conmutativo. Los elementos de A serán llamados ángulos.
Un representante cualquiera de cada clase de A, que viene dado por un número
real, será llamado determinación del ángulo ↵. Llamaremos determinación prin-
cipal de ↵ al número real perteneciente al intervalo [0, 2⇡) que sea representante
6 Sistemas de referencia en IR3
de una clase de IR /2⇡ZZ. Obtener la determinación principal de un ángulo es lo
mismo que calcular el resto de la división del número real que representa el ángulo
por 2⇡ o bien obtener el valor congruente (módulo 2⇡) de éste número.
Obsérvese que podemos definir un isomorfismo entre el conjunto A de ángulos
y el intervalo [0, 2⇡) a través de la determinación principal de cada ángulo. Por
ello, a partir de aqúı, cuando hablemos de ángulo nos referiremos siempre a su de-
terminación principal o a su valor ↵ 2 [0, 2⇡). Deesta forma quedarán justificadas
igualdades del tipo ↵+ ⇡ = ↵� ⇡ y otras que aparecen cuando obtenemos la de-
terminación principal de una combinación lineal de ángulos cuyo valor, obtenido
por reglas aritméticas, excede de 2⇡ o es menor que 0.
En ocasiones la práctica común exige la elección de otra determinación para
los ángulos, basada en una definición de los mismos en el intervalo (�⇡,⇡]. Esta
representación se establecerá para los ángulos definidos expĺıcitamente en dicho
intervalo o en un subintervalo de éste.
Las funciones trigonométricas o circulares
sen, cos : IR �! [�1, 1],
tan : IR �! IR[{�1,1},
son tres1 funciones suprayectivas y periódicas, de periodo 2⇡, cuyas propiedades
suponemos de sobra conocidas.
A pesar de no ser biyectivas, su periodicidad permite la definición de una
serie de funciones inversas llamadas arco coseno (acos), arco seno (asin) y arco
tangente (atan) que serán biyectivas si restringimos el intervalo de definición
acos : [�1, 1] �! [0,⇡],
asen : [�1, 1] �! [�⇡
2
,
⇡
2
],
atan : IR[{�1,1} �! [�⇡
2
,
⇡
2
].
(1.4)
Esta determinación de cuadrante es la usada habitualmente por todos los lengua-
jes de programación y calculadoras cuando se invocan las funciones inversas de
las circulares. Nótese además que la función acos aśı definida, cuando se usa para
la obtención del ángulo entre dos vectores, determina el menor de los dos posibles
o ángulo agudo.
Habitualmente el uso de las funciones arco coseno, arco seno y arco tangen-
te viene asociado a la resolución de ecuaciones del tipo cos↵ = x, sen↵ = x,
ó tan↵ = x. Si el significado geométrico de ↵ en dichas ecuaciones se restringe al
intervalo de definición de las funciones, la solución de cada una de esas ecuaciones
será única y vendrá dada por las funciones acos, asen, atan, respectivamente. En
1Las funciones sec, cosec, cotan, pueden considerarse funciones auxiliares de sen, cos y tan y
sus propiedades fácilmente deducibles a partir de ellas por lo que no son consideradas en esta
exposición.
Ángulos y funciones circulares inversas 7
caso contrario, si la solución puede ser un ángulo cualquiera en su determina-
ción principal, tendremos dos posibles soluciones por cada ecuación, que vendrán
expresadas por las funciones arccos, arcsin, arctan en lugar de acos, asen, atan,
cos↵ = x () ↵ = arccosx ()
⇢
↵
0
= acosx,
↵
1
= � acosx,
sen↵ = x () ↵ = arcsenx ()
⇢
↵
0
= asenx,
↵
1
= ⇡ � asenx,
tan↵ = x () ↵ = arctanx ()
⇢
↵
0
= atanx,
↵
1
= ⇡ + atanx.
(1.5)
Cuando conozcamos simultáneamente el coseno y el seno de un ángulo, cos↵ =
x, sen↵ = y, éste podrá ser encontrado sin ambigüedad tomando la solución
común de entre las dos obtenidas a partir de arccosx, arcsen y. Al igual que en
algunos lenguajes de programación, que definen una función arco tangente con
dos argumentos para resolver dicho caso, en lo que sigue utilizaremos la función
atan(x, y) que determina, sin ambigüedad, el ángulo ↵ que forma el punto (x, y) 2
IR2�{(0, 0)} con el eje Ox del plano, esto es, cuyo coseno es x/
p
x2 + y2 y cuyo
seno es y/
p
x2 + y2.
↵ = atan(x, y) ()
8
>
<
>
:
cos↵ =
x
p
x2 + y2
,
sen↵ =
y
p
x2 + y2
.
(1.6)
Nótese que hemos usado un orden de variables distinto a la función atan2 de
FORTRAN, pues hemos considerado que esta forma concuerda más con el lengua-
je habitual de las Matemáticas, donde la primera coordenada x suele representar
el coseno, y la segunda, y, el seno.
Propiedad.- La ecuación
tan
↵
2
= x, (1.7)
tiene una única solución dada por la expresión
↵ = 2atanx. (1.8)
En efecto, aplicando la función inversa
↵
2
= arctanx =
⇢
atanx,
⇡ + atanx,
(1.9)
y llamando ↵
0
,↵
1
a las dos soluciones, se tendrá
↵
1
= 2(⇡ + atanx) = 2⇡ + 2atanx = 2atanx = ↵
0
.
8 Sistemas de referencia en IR3
Propiedad.- Las dos soluciones de la ecuación
A = C cos↵+ S sen↵, A,B,C 2 IR, (1.10)
vienen dadas por la expresión
↵ = atan(C, S)� arccos
✓
Ap
C2 + S2
◆
. (1.11)
En efecto, si llamamos M,m, a las constantes definidas por
C = M cosm, S = M senm,
o lo que es igual
M =
p
C2 + S2, m = atan (C, S) ,
podremos poner
A = M cosm cos↵+M senm sen↵ = M cos(m� ↵),
de donde invirtiendo se llega a
m� ↵ = arccos
✓
A
M
◆
,
y finalmente
↵ = m� arccos
✓
A
M
◆
.
1.5 Producto vectorial y mixto
Como sabemos, dos vectores linealmente independientes de IR3 determinan un
plano. Además, podemos definir dos direcciones distintas, ortogonales al plano,
equivalentes a los conceptos relativos de encima y debajo del plano. Por otro lado,
las dos direcciones ortogonales al plano son opuestas entre si. Para caracterizar
estas dos direcciones estableceremos el concepto de producto vectorial.
Supongamos dos vectores x,y que forman entre si un ángulo2 ↵ = acos(x ·y).
Llamaremos producto vectorial de dos vectores x,y, y lo representaremos por
x⇥ y, a un vector que se caracteriza por:
Su norma, kx⇥ y k = kx kky k sen↵.
Su dirección, ortogonal al plano definido por x,y, que viene definida por la
dirección de avance de un sacacorchos o tornillo3 cuando gira para llevar el
vector x hacia el vector y por el camino más corto (ángulo agudo ↵).
Sistemas de referencia ortonormales 9
x
y
x⇥ y
xy
x⇥ y
Figura 1.2: Producto vectorial de dos vectores.
La figura 1.2 representa los dos posibles vectores x⇥y según la posición relativa
de x e y. Puede observarse también que las dos únicas direcciones ortogonales al
plano definido por dichos vectores se representan por los vectores x⇥ y e y ⇥ x,
que además verifican la relación
x⇥ y = �y ⇥ x.
Al producto escalar de un vector x por el vector resultante del producto vec-
torial de otros dos y⇥z, que puede también denotarse como [x,y, z] = x ·(y⇥z),
se le suele llamar producto mixto de tres vectores.
1.6 Sistemas de referencia ortonormales
La definición de ortogonalidad nos permite definir un sistema de referencia
donde los vectores de la base son ortogonales4 entre si
i
1
· i
2
= i
1
· i
3
= i
2
· i
3
= 0.
A dicho sistema de referencia le llamaremos sistema de referencia ortogonal. Si
además los vectores tienen norma unidad
i
2
1
= i
2
2
= i
2
3
= 1,
el sistema será llamado sistema de referencia ortonormal.
De acuerdo con lo visto en el apartado anterior, dados dos vectores ortogonales
y unitarios i
1
, i
2
, existen únicamente dos direcciones ortogonales al plano definido
2Como se ha dicho antes hemos elegido el menor de los dos posibles o ángulo agudo.
3Recuérdese que un sacacorchos avanza hacia arriba cuando gira en sentido contrario a las
agujas del reloj y hacia abajo en caso contrario.
4Tres vectores de IR3 ortogonales entre si son linealmente independientes.
10 Sistemas de referencia en IR3
por i
1
y i
2
. Estas dos direcciones son las representadas por los vectores i
1
⇥ i
2
e
i
2
⇥ i
1
, que en ambos casos tienen norma unidad de acuerdo con la definición de
producto vectorial.
De esta forma se llega a las dos posibles elecciones de sistemas de referencia
ortonormales: sistema directo (llamado también sistema dextrógiro o de orienta-
ción positiva) cuando i
3
= i
1
⇥ i
2
y sistema retrógrado (sistema levógiro o de
orientación negativa) cuando i
3
= i
2
⇥ i
1
.
i
1
i
2
i
3
i
1
i
2
i
3
Figura 1.3: Sistema de referencia de orientación positiva (izquierda) y de orientación
negativa (derecha). Nótese la posición distinta de los vectores i1, i2 en ambos sistemas.
Propiedad.- Para todo sistema ortogonal directo se verifica
1.
i
3
= i
1
⇥ i
2
, i
1
= i
2
⇥ i
3
, i
2
= i
3
⇥ i
1
. (1.12)
2. Dados dos vectores x = x
1
i
1
+ x
2
i
2
+ x
3
i
3
, y = y
1
i
1
+ y
2
i
2
+ y
3
i
3
, su
producto vectorial se puede expresar como
x⇥ y = (x
2
y
3
� x
3
y
2
)i
1
+ (x
3
y
1
� x
1
y
3
)i
2
+ (x
1
y
2
� x
2
y
1
)i
3
=
�
�
�
�
�
�
i
1
i
2
i
3
x
1
x
2
x
3
y
1
y
2
y
3
�
�
�
�
�
�
.
(1.13)
3. Dados tres vectores x = x
1i
1
+ x
2
i
2
+ x
3
i
3
, y = y
1
i
1
+ y
2
i
2
+ y
3
i
3
y
z = z
1
i
1
+ z
2
i
2
+ z
3
i
3
, su producto mixto se puede expresar como
[x,y, z] =
�
�
�
�
�
�
x
1
x
2
x
3
y
1
y
2
y
3
z
1
z
2
z
3
�
�
�
�
�
�
. (1.14)
Otras propiedades de los distintos productos de vectores 11
Propiedad.- Para todo sistema ortogonal retrógrado se verifica
1.
i
3
= i
2
⇥ i
1
, i
2
= i
1
⇥ i
3
, i
1
= i
3
⇥ i
2
, (1.15)
2. Dados dos vectores x = x
1
i
1
+ x
2
i
2
+ x
3
i
3
, y = y
1
i
1
+ y
2
i
2
+ y
3
i
3
, su
producto vectorial se puede expresar como
x⇥ y = (y
2
x
3
� y
3
x
2
)i
1
+ (y
3
x
1
� y
1
x
3
)i
2
+ (y
1
x
2
� y
2
x
1
)i
3
=
�
�
�
�
�
�
i
1
i
2
i
3
y
1
y
2
y
3
x
1
x
2
x
3
�
�
�
�
�
�
.
(1.16)
3. Dados tres vectores x = x
1
i
1
+ x
2
i
2
+ x
3
i
3
, y = y
1
i
1
+ y
2
i
2
+ y
3
i
3
y
z = z
1
i
1
+ z
2
i
2
+ z
3
i
3
, su producto mixto se puede expresar como
[x,y, z] =
�
�
�
�
�
�
x
1
x
2
x
3
z
1
z
2
z
3
y
1
y
2
y
3
�
�
�
�
�
�
. (1.17)
Las dos propiedades anteriores caracterizan los sistemas directos y retrógrados
cuya representación gráfica puede verse en la figura 1.3.
La definición de producto vectorial no es útil para el cálculo del mismo. Para
realizar este cálculo es necesario acudir a una de las expresiones (1.13) o (1.16).
Hay que hacer notar aqúı que únicamente la primera es usada en la mayoŕıa de
los libros y las libreŕıas de los lenguajes de programación. Esto supone que de
manera impĺıcita dichos libros y programas trabajan con un sistema de referencia
ortogonal directo.
En Astronomı́a, se utilizan dos sistemas de coordenadas, horizontales y hora-
rias, que se definen habitualmente a través de sistemas de referencia retrógrados.
En este libro, con objeto de evitar el problema generado por las distintas propie-
dades del producto vectorial, utilizaremos únicamente sistemas directos, para lo
que redefiniremos las coordenadas asociadas a los sistemas retrógrados.
1.7 Otras propiedades de los distintos productos
de vectores
Daremos a continuación otras propiedades de los productos de vectores que
son independientes de la orientación de la base elegida para su cálculo. Estas
propiedades serán usadas a lo largo del libro.
12 Sistemas de referencia en IR3
Propiedad .- Las relaciones siguientes son válidas independientemente del siste-
ma de referencia en el que expresemos los vectores:
x⇥ (y + z) = x⇥ y + x⇥ z, (1.18)
(x⇥ y)2 = kx k2ky k2 � (x · y)2, (1.19)
(x⇥ y)⇥ z = (x · z)y � (y · z)x, (1.20)
x⇥ (y ⇥ z) = (x · z)y � (x · y)z. (1.21)
Propiedad.- El área de un triángulo de vértices O,P,Q viene dada por el valor
de kx⇥ y k/2, siendo x = OP, y = OQ.
Propiedad.- Dados dos vectores ortogonales a, b, y un escalar c, el sistema
x⇥ a = b,
x · a = c,
(1.22)
tiene como única solución
x =
a⇥ b+ ca
a · a . (1.23)
En efecto,
a⇥ b = a⇥ (x⇥ a) = (a · a)x� (a · x)a,
de donde despejando se llega a la solución.
1.8 Ángulo orientado entre dos vectores
La ecuación (1.3) nos ha permitido introducir el concepto de ángulo y su
medida a través del producto escalar. La solución de dicha ecuación conduce,
como se ve en la figura 1.1, a dos valores, ↵ y 2⇡�↵, que representan igualmente
al ángulo salvo que las propiedades geométricas de un determinado problema
restrinjan el rango de valores a un subintervalo de [0, 2⇡).
También podremos discriminar uno de los dos posibles valores cuando defina-
mos un sentido de recorrido de los ángulos y tomemos uno de los dos vectores
como origen (de aqúı en adelante x). Generalmente se considera sentido de giro
positivo al recorrido en sentido contrario a las agujas del reloj y sentido de gi-
ro negativo al recorrido en sentido de las agujas de un reloj. En dinámica suele
hablarse también de sentido directo y sentido retrógrado respectivamente. Habi-
tualmente se considera positivo el signo de los ángulos medidos en sentido directo
y negativo los medidos en sentido retrógrado.
La anterior definición contiene también una ambigüedad, pues el sentido posi-
tivo se transforma en negativo, y viceversa, cuando miramos la figura desde el otro
Ángulo orientado entre dos vectores 13
lado del plano determinado por los vectores x,y. Dicha ambigüedad quedará eli-
minada fijando, mediante el producto vectorial de los dos vectores, el subespacio
desde el cual observamos el giro.
Para fijar los conceptos de ángulo directo o retrógrado entre dos vectores x,y,
o ángulo que va de x a y en sentido positivo o negativo, debemos fijar, en primer
lugar, una orientación o dirección n, definida a partir del vector (x⇥y)/kx⇥y k o
del vector (y⇥x)/kx⇥y k. Fijado n, hablaremos de ángulo directo, o recorrido en
sentido positivo o directo, como aquel que lleva el vector x hacia y en el sentido de
giro contrario a las agujas del reloj visto desde la dirección del espacio definida por
el vector n. Un ángulo retrógrado, o recorrido en sentido negativo o retrógrado,
es el ángulo recorrido en sentido contrario al anterior. Habitualmente todos los
libros usan, sin mencionarlo, la orientación definida por n = (x⇥ y)/kx⇥ y k.
El concepto de sistema ortogonal directo nos va a permitir determinar, de una
manera precisa, el ángulo directo entre dos vectores x,y, una vez hayamos definido
la orientación n. En efecto, por ser n ortogonal a x podemos definir un sistema
de referencia ortonormal directo formado por los vectores {i
1
= x/kx k, i
2
=
n⇥x/kn⇥x k, i
3
= n}. Notemos que por ser n y x ortogonales se tiene kn⇥x k =
kx k y por tanto i
2
= (n⇥x)/kx k. El vector ŷ, que pertenece al plano formado
por i
1
y i
2
podrá expresarse como
ŷ = p i
1
+ q i
2
,
o lo que es igual
y = ky kp i
1
+ ky kq i
2
.
Si llamamos ↵ = atan(p, q) tendremos que
y = ky k cos↵ i
1
+ ky k sen↵ i
2
,
de donde podremos poner
ky k cos↵ = y · i
1
=
x · y
kx k , ky k sen↵ = y · i
2
=
y · (n⇥ x)
kx k =
n · (x⇥ y)
kx k ,
y finalmente
kx kky k cos↵ = x · y, kx kky k sen↵ = n · (x⇥ y), (1.24)
o lo que es igual
↵ = ↵(x,y,n) = atan (x · y, n · (x⇥ y)) . (1.25)
La expresión (1.25) nos da de manera precisa y única el valor del ángulo que va
de x a y en sentido positivo desde la orientación definida por el vector n.
14 Sistemas de referencia en IR3
1.9 Coordenadas cartesianas y polares
Las componentes (x, y, z) de un vector x = x i
1
+ y i
2
+ z i
3
, expresado en un
sistema de referencia ortogonal directo {i
1
, i
2
, i
3
}, serán llamadas coordenadas
cartesianas o coordenadas rectangulares y representan:
Las proyecciones del vector x sobre los ejes Ox, Oy y Oz o direcciones i
1
, i
2
e i
3
respectivamente.
Los cosenos directores, o cosenos de los ángulos que forma el vector x con
los ejes Ox,Oy y Oz:
x = kx k cos(x, i
1
) = x · i
1
,
y = kx k cos(x, i
2
) = x · i
2
,
z = kx k cos(x, i
3
) = x · i
3
.
En Astronomı́a, donde en ocasiones la medida de la distancia a los astros no
es conocida, resulta de particular importancia el uso de las coordenadas polares
esféricas que separan la distancia al origen de las otras coordenadas angulares.
Para definir las coordenadas polares esféricas (figura 1.4) consideraremos, en
primer lugar, un vector l de norma igual a kx k y cuya dirección representa la
intersección del plano formado por x e i
3
con el plano Oxy formado por i
1
e
i
2
. Llamaremos longitud � al ángulo desde i
1
hasta l medido en sentido directo
tomando como orientación la definida por el vector i
3
. La longitud puede tomar
un valor cualquiera � 2 [0, 2⇡).
Llamaremos latitud � al ángulo entre l y x. Este ángulo se considera positivo
si el vector x está en el lado del espacio correspondiente a i
3
y negativo si está en
el correspondiente a �i
3
. De esta forma � 2 [�⇡/2,⇡/2].
Por último llamaremos distancia r a la norma kx k.
Las coordenadas (r,�,�) serán llamadas coordenadas polares esféricaso sim-
plemente coordenadas esféricas y se caracterizan principalmente por separar la
distancia r de las cantidades angulares adimensionales �,�.
En ocasiones hablaremos de la colatitud o ángulo �̃ = ⇡/2 � � 2 [0,⇡] entre
i
3
y x y de la colongitud o ángulo �̃ entre i
2
y l, medido en sentido retrógrado.
Fácilmente comprobamos que también se verifica �̃ = ⇡/2� � 2 [0, 2⇡).
El uso de la colatitud y la colongitud permite usar los sistemas de coordenadas
(r,�, �̃), (r, �̃,�), (r, �̃, �̃) como alternativa al sistema de coordenadas polares
esféricas.
Observando la figura 1.4 se deduce fácilmente que un vector unitario l̂ pertene-
ciente al plano Oxy y que tiene una longitud �, forma tres ángulos (�,⇡/2��,⇡/2)
con los tres vectores de la base, por lo que sus componentes, dadas por los cosenos
directores serán
l̂ = cos� i
1
+ cos(
⇡
2
� �) i
2
+ cos
⇡
2
i
3
= cos� i
1
+ sen� i
2
.
Coordenadas cartesianas y polares 15
�
�
�̃
�̃
i
1
i
2
i
3
x
l
Figura 1.4: Coordenadas polares esféri-
cas.
De esta forma, se tendrá, por un lado
l = r cos� i
1
+ r sen� i
2
,
y por otro,
x = r cos� l+ r cos �̃ i
3
= r cos� l+ r sen� i
3
,
por lo que finalmente se llega a la expre-
sión del vector en coordenadas polares
esféricas
x = r cos� cos� i
1
+
r sen� cos� i
2
+
r sen� i
3
,
(1.26)
lo que demuestra que las coordenadas cartesianas pueden expresarse en función
de las polares esféricas en la forma:
x = r cos� cos�,
y = r cos� sen�,
z = r sen�.
(1.27)
Asimismo, invirtiendo las relaciones anteriores obtenemos las coordenadas esféri-
cas en función de las rectangulares:
r =
p
x2 + y2 + z2,
� = asen
z
r
,
� = atan(x, y).
(1.28)
Puesto que el paso de cartesianas a polares y el de polares a cartesianas serán
muy usados a lo largo del libro estableceremos, de aqúı en adelante una nota-
ción más compacta que establece el nombre de una función que a través de los
algoritmos (1.27) y (1.28) realiza la transformación.
Llamaremos cart() a la función que obtiene el vector x = (x, y, z) a partir del
vector de coordenadas polares (r,�,�),
x =
0
@
x
y
z
1
A =
0
@
r cos� cos�
r cos� sen�
r sen�
1
A = cart(r,�,�). (1.29)
Para referirnos a cada una de sus componentes podremos usar las funciones:
x = cart
1
(r,�,�), y = cart
2
(r,�,�), z = cart
3
(r,�,�). (1.30)
16 Sistemas de referencia en IR3
Por otro lado, la función polar() representará la inversa de la anterior, es decir,
nos dará el vector de coordenadas polares en función del vector en cartesianas
(r,�,�) = polar(x). (1.31)
Para referirnos a cada coordenada polar por separado usaremos las funciones
siguientes:
r = polar
r
(x), � = polar
�
(x), � = polar
�
(x). (1.32)
Combinando el uso de la colatitud y colongitud con las coordenadas polares
podremos poner:
x = r sen �̃ cos� i
1
+ r cos �̃ cos� i
2
+ r sen� i
3
, (1.33)
x = r cos� sen �̃ i
1
+ r sen� sen �̃ i
2
+ r cos �̃ i
3
, (1.34)
x = r sen �̃ sen �̃ i
1
+ r cos �̃ sen �̃ i
2
+ r cos �̃ i
3
, (1.35)
o bien usando la función cart() escribiremos
x = cart(r,
⇡
2
� �̃,�) = cart(r,�,
⇡
2
� �̃) = cart(r,
⇡
2
� �̃, ⇡
2
� �̃).
1.10 Trigonometŕıa esférica
Una de las caracteŕısticas de la observación astronómica es la imposibilidad de
una medición visual directa de la distancia al astro, pudiéndose medir únicamente
distancias angulares. Las coordenadas polares resultan perfectamente adaptadas
a la premisa anterior pues separan la distancia r al astro de las dos coordenadas
angulares.
Desde un punto de vista práctico prescindir de la distancia equivale a suponer
todos los astros proyectados sobre una esfera de radio arbitrario que tomaremos
como unidad. Esta esfera es llamada esfera celeste. En el caso de las órbitas de
los cuerpos del sistema solar y de las naves espaciales la distancia es mucho me-
nor que la distancia a las estrellas por lo que debe ser tomada en consideración,
sin embargo, los parámetros angulares de su órbita pueden separarse y ser estu-
diados sustituyendo la órbita por su proyección en la esfera celeste que será una
circunferencia.
La necesidad de relacionar puntos en una esfera nos lleva a considerar una
herramienta muy usada en Astronomı́a clásica: la trigonometŕıa esférica. En este
libro se ha limitado al máximo el uso de triángulos esféricos, sin embargo, por
claridad en la lectura de otros libros de Astrodinámica y Mecánica Celeste se
estudian en este apartado las fórmulas básicas de la trigonometŕıa esférica: las
fórmulas de Bessel.
Comenzaremos recordando que la intersección de la esfera con un plano que
pase por su centro es una circunferencia que llamaremos ćırculo máximo. Si el
plano no pasa por el centro de la esfera el ćırculo será llamado ćırculo menor.
Trigonometŕıa esférica 17
Por otro lado, dados dos puntos en una esfera, existe uno y solo un ćırculo
máximo que pasa por ellos, pues estos dos puntos, junto con el centro determinan
un plano que corta a la esfera en dicho ćırculo máximo. Nótese que el ćırculo
máximo es el equivalente a la recta en la geometŕıa plana.
En geometŕıa plana, queda perfectamente determinado el concepto de seg-
mento de recta como la parte de la recta que une dos puntos. Sin embargo, dados
dos puntos en la esfera, al ser cerrado el ćırculo máximo que los une, quedan
determinados dos segmentos y no uno. Para evitar confusiones consideraremos
únicamente como segmento que une dos puntos al menor de ambos.
Uno de los parámetros que representan un segmento de recta es su longitud.
Esto ocurre también cuando consideramos un segmento de ćırculo máximo, sin
embargo, puesto que al trabajar en la esfera se pretende eliminar el concepto
de distancia, o lo que es igual las dimensiones de longitud, deberemos sustituir
el concepto de longitud del segmento por algún otro concepto equivalente. Para
ello, basta recordar la expresión l = r✓, que relaciona la longitud del segmento
de circunferencia con el producto del arco que éste abarca por el radio de la
circunferencia. Si consideramos el radio como unidad de distancia, la longitud
del segmento equivale al arco. Aśı pues, a partir de ahora, cuando hablemos de
longitud del segmento que une dos puntos de la esfera, entenderemos como tal el
arco que dicho segmento abarca, expresado en radianes.
Tres puntos no alineados en un plano forman un triángulo plano, que queda
caracterizado por seis parámetros: la longitud de los tres lados y los ángulos que
forman entre si los tres lados. Si tomamos tres puntos sobre una esfera podemos
unirlos dos a dos por medio de segmentos de ćırculo máximo (figura 1.5). La figura
formada en la esfera por estos tres segmentos será llamada triángulo esférico.
a
b c
A
B
C
Figura 1.5: Triángulo esférico.
Un triángulo esférico viene caracterizado también por seis elementos: la lon-
gitud de sus tres lados (a, b, c), que como hemos dicho antes viene expresada en
18 Sistemas de referencia en IR3
radianes, y por sus tres ángulos (A,B,C) que quedan definidos por los tres ángulos
que forman entre si los planos que definen cada par de ćırculos máximos. Debido
a la forma de elegir el segmento entre los dos posibles, los tres lados verifican la
relación a 2 [0,⇡], b 2 [0,⇡], c 2 [0,⇡]. De la misma forma esto obliga a que se
verifiquen también las relaciones A 2 [0,⇡], B 2 [0,⇡], C 2 [0,⇡].
La trigonometŕıa esférica permite obtener los seis elementos de un triángulo
esférico a partir de tres cualesquiera de ellos.
1.10.1 Fórmulas de Bessel
Con objeto de encontrar las fórmulas que nos permitirán resolver un triángulo
esférico, definiremos un sistema de referencia en el que el origen coincida con el
centro de la esfera. De esta forma los vectores, de norma unidad, que unen el origen
con cada vértice del triángulo esférico serán llamados a = OA, b = OB, c = OC.
⇡
2
� c ⇡
2
� b
A
A
a
b
c
Figura 1.6: Vectores que definen los vérti-
ces del triángulo.
Elegiremos un sistema dereferen-
cia ortogonal directo de forma que
i
3
= a, y b esté en el plano formado
por Oxz. Aśı, atendiendo a la figura
1.6, podemos deducir que:
a = i
3
,
b = sen c i
1
+ cos c i
3
,
c = sen b cosA i
1
+
sen b senA i
2
+ cos b i
3
.
(1.36)
Puesto que el ángulo entre cada par de
vectores es igual al lado que forman
sus vértices podremos poner, por un
lado
b · c = cos a,
y por otro, sustituyendo el valor de los
vectores dado por las relaciones (1.36),
obtendremos
b · c = cos b cos c+ sen b sen c cosA.
Igualando las dos últimas ecuaciones se obtiene la expresión
cos a = cos b cos c+ sen b sen c cosA, (1.37)
que es la conocida como primera fórmula de Bessel o fórmula del coseno.
Tanto en la anterior como en todas las fórmulas de la trigonometŕıa esférica
podemos permutar las tres letras que representan lados y ángulos distintos. De esta
forma las fórmulas obtenidas no serán únicas. En particular, la primera fórmula de
Bessel debe leerse de la siguiente forma: el coseno de un lado es igual al producto
Trigonometŕıa esférica 19
de los cosenos de los otros dos lados más el producto de los senos de los otros dos
lados por el coseno del ángulo opuesto al primer lado. Aśı tendremos tres y no
una fórmula del coseno.
Por otro lado, llamaremos A,B,C a los vectores unitarios ortogonales a los
planos que contienen cada lado del triángulo esférico y cuya expresión viene dada
como
C =
a⇥ b
ka⇥ b k , B =
c⇥ a
k c⇥ a k , A =
b⇥ c
k b⇥ c k , (1.38)
o lo que es igual
A =
� cos c senA sen b
sen a
i
1
+
cosA cos c sen b� cos b sen c
sen a
i
2
+
senA sen b sen c
sen a
i
3
,
B = senA i
1
� cosA i
2
,
C = i
2
.
(1.39)
Los extremos de los vectores A,B,C forman otro triángulo esférico (figura
1.7), que es llamado triángulo polar, cuyos lados son a0 = ⇡ �A, b0 = ⇡ �B, c0 =
⇡ � C y cuyos ángulos son A0 = ⇡ � a,B0 = ⇡ � b, C 0 = ⇡ � c.
⇡
2
�A
A
a
b
c
A
B
C
Figura 1.7: Triángulo polar.
Por ser ⇡ � B el ángulo entre A y
C tendremos, por un lado, que
kA⇥C k = kA kkC k sen(⇡ �B)
= senB,
y por otro lado
sen2 B = kA⇥C k2 = (A⇥C)·(A⇥C).
Si sustituimos las expresiones dadas
en (1.39), desarrollamos y efectuamos
ciertas simplificaciones, llegaremos a la
igualdad
sen a senB = sen b senA. (1.40)
Escribiendo esta expresión para to-
das las permutaciones de letras se obtiene la segunda fórmula de Bessel o fórmula
de los senos que puede también expresarse en la forma siguiente
sen a
senA
=
sen b
senB
=
sen c
senC
. (1.41)
Por último, si calculamos el producto escalar de A por C, tendremos por un
lado
A ·C = cos(⇡ �B) = � cosB,
20 Sistemas de referencia en IR3
y por otro
A ·C =
� cos b sen c+ sen b cos c cosA
sen a
,
lo que lleva finalmente a obtener la tercera fórmula de Bessel
sen a cosB = cos b sen c� sen b cos c cosA. (1.42)
Las tres fórmulas de Bessel son válidas para cualquier triángulo esférico, por
tanto lo serán también para el triángulo polar. Aśı pues si las aplicamos para los
elementos a0 = ⇡ � A, b0 = ⇡ �B, c0 = ⇡ � C,A0 = ⇡ � a,B0 = ⇡ � c, C 0 = ⇡ � c,
obtendremos, por un lado
cosA = � cosB cosC + senB senC cos a, (1.43)
que será llamada primera fórmula polar, y por otro
senA cos b = cosB senC + senB cosC cos a, (1.44)
que será llamada tercera fórmula polar.
La segunda de Bessel aplicada al triángulo polar vuelve a dar la misma ex-
presión, por lo que ha sido omitida y es la razón por la que no hemos definido
ninguna segunda fórmula polar.
1.10.2 Regla del pentágono de Neper
Las fórmulas de Bessel se simplifican cuando alguno de los elementos, bien
sea un lado o un ángulo, vale 90�. A un triángulo de este tipo le llamaremos
respectivamente triángulo rectilátero o triángulo rectángulo.
Neper reunió todas las formulas de Bessel particularizadas para ambos casos y
consiguió enunciar una regla muy simple, llamada regla del pentágono de Neper,
que relaciona entre si todos los elementos de estos triángulos.
Estas reglas van asociadas a cada uno de los pentágonos dibujados en las
figuras 1.8(a), 1.8(b). Estos pentágonos pueden modificarse con una permutación
cualquiera de las letras en él representadas.
Hay dos reglas para cada pentágono que se pueden enunciar de la siguiente
forma:
El coseno de un elemento situado en un vértice es igual al producto de las
cotangentes de los elementos situados en vértices contiguos.
El coseno de un elemento situado en un vértice es igual al producto de los
senos de los elementos situados en vértices opuestos.
Trigonometŕıa esférica 21
A = 90�
a
B C
90� � c 90� � b
(a) Triángulo rectángulo.
a = 90�
180� �A
b c
90� � C 90� �B
(b) Triángulo rectilátero.
Figura 1.8: Pentágono de Neper.
1.10.3 Analoǵıas de Neper
Las cinco fórmulas de Bessel, y las que se derivan de la posible permutación
de letras, permiten la resolución de cualquier tipo de triángulo esférico a partir
de tres datos del mismo. Sin embargo, con objeto de discriminar de forma sencilla
entre dos posibles soluciones es conveniente el uso de otro conjunto de fórmulas,
obtenidas a partir de las anteriores, que serán llamadas analoǵıas de Neper.
Las analoǵıas de Neper5 pueden escribirse como:
tan
A
2
= cos
b� c
2
sec
b+ c
2
cot
B + C
2
,
tan
a
2
= sec
B � C
2
cos
B + C
2
tan
b+ c
2
.
(1.45)
Veremos únicamente la obtención de la primera, pues el resto se obtiene de
manera idéntica. Para ello, reuniremos convenientemente las expresiones (1.41)
llegando a
sen a (senB + senC) = senA (sen b+ sen c),
por otro lado, aplicando dos de las permutaciones de las terceras fórmulas de
Bessel (1.42), se llega a
sen a(cosB + cosC) = (1� cosA)(cos c sen b+ cos b sen c),
que divididas nos conducen a
senB + senC
cosB + cosC
=
senA (sen b+ sen c)
(1� cosA)(cos c sen b+ cos b sen c)
.
5Existen otras expresiones similares, pero éstas nos dan la información suficiente para com-
pletar el algoritmo del próximo apartado.
22 Sistemas de referencia en IR3
Usando simples relaciones trigonométricas se llega finalmente a
tan
B + C
2
= cos
b� c
2
sec
b+ c
2
cot
A
2
,
que coincide con la primera de las expresiones (1.45).
1.10.4 Algoritmo para la resolución de triángulos esféricos
Podemos encontrar un algoritmo muy simple para resolver cualquier triángulo
esférico si tenemos en cuenta las siguientes propiedades derivadas de las funciones
trigonométricas:
Cualquier lado o ángulo de un triángulo esférico está en el primer o segun-
do cuadrante luego para determinarlo uńıvocamente se precisa conocer su
coseno.
La tangente del ángulo mitad determina, sin ambigüedad el cuadrante de
cualquier ángulo.
La resolución de un triángulo esférico del que conocemos tres elementos se
realizará mediante seis conjuntos de fórmulas que representan casos idénticos salvo
una permutación de letras.
1. Tres ángulos (A,B,C) conocidos.
Solución única obtenida a partir de las tres fórmulas polares del coseno.
2. Tres lados (a, b, c) conocidos.
Solución única obtenida a partir de las tres fórmulas del coseno.
3. Conocidos dos lados y un ángulo de manera que el ángulo no sea opuesto a
ninguno de los dos lados. Esto corresponde a los tres casos: (a, b, C), (a, c, B),
(b, c, A).
Cada uno de estos casos tiene solución única en la que el tercer lado se
obtiene por aplicación directa de la fórmula del coseno, y una vez obtenido
éste, los otros dos ángulos se obtienen como en el segundo caso por aplicación
de las fórmulas del coseno.
4. Conocidos dos ángulos y un lado de manera que el lado no sea opuesto
a ninguno de los dos ángulos. Esto corresponde a los tres casos: (A,B, c),
(A,C, b), (B,C, a).
Cada uno de estos casos tiene solución única en la que el tercer ángulo se
obtiene por aplicación directa de la fórmula polar del coseno, y una vez
obtenido éste, los otros dos lados se obtienen como en el primer caso por
aplicación de las fórmulas polares del coseno.
Trigonometŕıa esférica 23
5. Conocidosdos lados y un ángulo de manera que el ángulo sea opuesto a
alguno de los dos lados. Esto corresponde a los seis casos: (a, b, A), (a, b, B),
(a, c, A), (a, c, C), (b, c, B), (b, c, C).
Cada uno de estos casos tiene solución doble. Por ejemplo el caso (a, b, A)
se resuelve aplicando en primer lugar la fórmula de los senos para obtener
B. Del seno se obtienen dos valores B
1
, B
2
que serán llevados junto con los
de (a, b, A) a las analoǵıas de Neper para obtener c y C. El resto de casos se
resuelve también con una aplicación de la fórmula de los senos y luego las
dos analoǵıas de Neper.
6. Conocidos dos ángulos y un lado de manera que el lado sea opuesto a alguno
de los dos ángulos. Esto corresponde a los seis casos: (A,B, a), (A,B, b),
(A,C, a), (A,C, c), (B,C, b), (B,C, c).
Cada uno de estos casos tiene solución doble. Por ejemplo el caso (A,B, a)
se resuelve aplicando en primer lugar la fórmula de los senos para obtener
b. Del seno se obtienen dos valores b
1
, b
2
que serán llevados junto con los
de (a, b, A) a las analoǵıas de Neper para obtener c y C. El resto de caos se
resuelve también con una aplicación de la fórmula de los senos y luego las
dos analoǵıas de Neper.
La indicación de solución única o doble de cada uno de los seis casos representa
únicamente el número máximo de soluciones. En todos los casos puede haber
menos soluciones. La anulación de la solución obtenida se realizará cuando se
obtenga un valor mayor que la unidad para un seno o un coseno o al aplicar las
analoǵıas de Neper se obtenga un ángulo mayor que 180�.
24 Sistemas de referencia en IR3
Caṕıtulo 2
Cambios del sistema de
referencia: rotaciones
2.1 Introducción
Si tenemos un punto P , referido a un sistema de referencia {O, i
1
, i
2
, i
3
}, y
queremos expresarlo en el sistema {O0,f
1
,f
2
,f
3
} debemos transformar la expre-
sión del vector OP en la base inicial {i
1
, i
2
, i
3
} en la expresión del vector O0P en
la base del sistema final {f
1
,f
2
,f
3
}. Para ello debemos realizar dos operaciones:
una traslación del origen, dada por la relación OP = OO0 +O0P ,
un cambio de base para expresar los tres vectores de la relación anterior en
la base del sistema final.
En adelante prescindiremos de la traslación, suma del vector OO0, por la sim-
plicidad de esta operación y porque en la práctica casi todos los cambios de sistema
de referencia que trataremos en este libro mantienen fijo el origen.
Un cambio entre dos bases ortonormales de IR3 con la misma orientación
será llamado rotación del sistema de referencia.
26 Cambios del sistema de referencia: rotaciones
2.2 Rotaciones en IR3
Sea un vector x 2 IR3 que, expresado en la base1 I = {i
1
, i
2
, i
3
}, tiene la
forma
x = x
1
i
1
+ x
2
i
2
+ x
3
i
3
, (2.1)
mientras que en la base F = {f
1
,f
2
,f
3
} se escribe
x = X
1
f
1
+X
2
f
2
+X
3
f
3
. (2.2)
Para relacionar las componentes de x en ambas bases tendremos en cuenta,
por un lado, que por ser F base de IR3 cualquier vector de IR3 podrá ser expresado
en dicha base, por tanto, podremos escribir:
i
1
= r
11
f
1
+ r
12
f
2
+ r
13
f
3
,
i
2
= r
21
f
1
+ r
22
f
2
+ r
23
f
3
,
i
3
= r
31
f
1
+ r
32
f
2
+ r
33
f
3
,
(2.3)
mientras que, por ser I base de IR3, cualquier vector de IR3 podrá ser expresado
en dicha base en la forma:
f
1
= s
11
i
1
+ s
12
i
2
+ s
13
i
3
,
f
2
= s
21
i
1
+ s
22
i
2
+ s
23
i
3
,
f
3
= s
31
i
1
+ s
32
i
2
+ s
33
i
3
.
(2.4)
Por ser las bases ortonormales, las componentes de un vector pueden obtenerse
a través de los cosenos directores, luego se tendrá
r
ij
= cos(i
i
,f
j
) = i
i
· f
j
= cos(f
j
, i
i
) = s
ji
,
lo que permite finalmente escribir:
f
1
= r
11
i
1
+ r
21
i
2
+ r
31
i
3
,
f
2
= r
12
i
1
+ r
22
i
2
+ r
32
i
3
,
f
3
= r
13
i
1
+ r
23
i
2
+ r
33
i
3
.
(2.5)
Si en la igualdad (2.2) sustituimos los vectores f
i
por las expresiones dadas
en (2.5), y la igualamos, componente a componente, a (2.1), obtendremos tres
relaciones que en forma matricial se podrán poner como
0
@
x
1
x
2
x
3
1
A =
0
@
r
11
r
12
r
13
r
21
r
22
r
23
r
31
r
32
r
33
1
A
0
@
X
1
X
2
X
3
1
A . (2.6)
1Cuando no haya ambigüedad en el origen identificaremos con el mismo nombre al sistema
de referencia y a la base que lo forma.
Rotaciones en IR3 27
De la misma forma, sustituyendo en la igualdad (2.1) los vectores i
i
por las
expresiones dadas en (2.3) e igualando, componente a componente, a (2.2) obten-
dremos la relación inversa de (2.6) en la forma
0
@
X
1
X
2
X
3
1
A =
0
@
r
11
r
21
r
31
r
12
r
22
r
32
r
13
r
23
r
33
1
A
0
@
x
1
x
2
x
3
1
A . (2.7)
De aqúı en adelante, dado un vector cualquiera x de IR3, utilizaremos un
sub́ındice que coincida con el nombre de un sistema de referencia para indicar el
vector columna formado por las componentes de x en la base de dicho sistema de
referencia. De esta forma xI ,xF serán:
xI =
0
@
x
1
x
2
x
3
1
A , xF =
0
@
X
1
X
2
X
3
1
A .
Por otro lado, llamando
RIF =
0
@
r
11
r
12
r
13
r
21
r
22
r
23
r
31
r
32
r
33
1
A , (2.8)
a la matriz cuyas columnas son las componentes de la base F en términos de la
base I, la relación (2.6) se podrá poner como
xI = RIFxF , (2.9)
mientras que la matriz
RFI =
0
@
r
11
r
21
r
31
r
12
r
22
r
32
r
13
r
23
r
33
1
A , (2.10)
permite poner la ecuación (2.7) en la forma
xF = RFIxI . (2.11)
A partir de las propiedades anteriores se demuestra que la inversa de una
matriz de rotación coincide con su traspuesta
RFI = R�1
IF = RT
IF .
Las matrices que cumplen esta importante propiedad son llamadas matrices or-
togonales.
La notación anterior, que usa dos sub́ındices que representan los nombres
de los dos sistemas de referencia, no presenta ningún tipo de ambigüedad en
la expresión de la rotación. Sin embargo, esto no sucede aśı cuando se define
28 Cambios del sistema de referencia: rotaciones
el concepto de matriz de rotación. Revisando la literatura nos encontramos dos
definiciones distintas que responden a dos convenios diferentes. Los dos convenios
son correctos siempre que no se mezclen entre si.
Convenio A.- Llamaremos matriz de rotación entre los sistemas de referencia I
y F , y la representaremos por el śımbolo R a la matriz RIF que permite expresar
el vector xI como producto de la matriz R por el vector xF .
Convenio B.- Llamaremos matriz de rotación entre los sistemas de referencia I
y F , y la representaremos por el śımbolo eR a la matriz RFI que permite expresar
el vector xF como producto de la matriz eR por el vector xI .
Puede parecer absurdo introducir en este texto ambos convenios, sobre todo
después de haber establecido inicialmente una notación que no contiene ninguna
ambigüedad, sin embargo, hemos preferido introducir las dos notaciones con ob-
jeto de no modificar expresiones que son de uso común en la comunidad cient́ıfica,
en la que no siempre coincide el convenio utilizado para expresar las rotaciones.
Siempre que sea posible utilizaremos los sub́ındices para evitar confusiones, en
otros casos utilizaremos la notación con o sin tilde para especificar el convenio
utilizado sin recordarlo en cada caso.
2.3 Composición de rotaciones
Supongamos que partimos de un sistema de referencia S
1
y vamos aplicando
sucesivamente rotaciones que pasan de S
1
a S
2
, de S
2
a S
3
, etc. Llamaremos,
respectivamente,
R
i
= RSiSi+1
, eR
i
= RSi+1Si
,
a las matrices de cada rotación en ambos convenios.
Sustituyendo sucesivamente el vector xSi
por el producto RSiSi+1
xSi+1
se
podrá poner
xS1
= RS1S2
RS2S3
. . .RSn�1Sn
xSn
, (2.12)
obteniéndose la matriz de giro como producto de las sucesivas matrices de giro en
el orden en que éstos se producen.
La expresión (2.12) puede ponerse también en la forma
xS1
= RxSn
, xSn
= eRxS1
, (2.13)
donde hemos llamado
R= R
1
R
2
. . .R
n�1
, (2.14)
a la matriz de giro compuesto en el primer convenio y
eR = eR
n�1
. . . eR
2
eR
1
, (2.15)
a la matriz de giro compuesto en el segundo convenio. Podemos observar que el
orden de las matrices en el producto cambia de un convenio al otro.
Rotación de un vector alrededor de un eje 29
2.4 Rotación de un vector alrededor de un eje
â
(x · â)â
R[↵, â][x]
â⇥ x(â⇥ x)⇥ â
R[↵, â][(â⇥ x)⇥ â]
x
Figura 2.1: Rotación de un vector alrededor de
un eje.
Estudiaremos ahora el pro-
blema de la rotación de un vec-
tor x, un cierto ángulo ↵, alrede-
dor de un eje â. El valor positi-
vo o negativo del ángulo ↵ gira-
do vendrá definido por la orien-
tación dada por el vector â. Lla-
maremos R[↵, â][x] al vector re-
sultante de la rotación que puede
verse en la figura 2.1.
Para obtener el valor de dicho
vector elegiremos un sistema de
referencia ortogonal directo en el
que â representa el eje Oz, el eje
Oy vendrá definido por el vector
â⇥x, ortogonal a â, y por último
el eje Ox por la dirección (â ⇥
x)⇥ â, la única posible para que
el sistema sea ortogonal y directo. De esta forma hemos elegido una base ortogonal
{(â⇥ x)⇥ â, â⇥ x, â}.
La propiedad (1.20) permite escribir
x = (x · â)â+ (â⇥ x)⇥ â,
por lo que, de acuerdo con la figura 2.1, tendremos
R[↵, â][x] = (x · â)â+R[↵, â][(â⇥ x)⇥ â].
Teniendo en cuenta que R[↵, â][(â⇥ x)⇥ â] pertenece al plano Oxy y tiene una
longitud ↵, podremos poner
R[↵, â][(â⇥ x)⇥ â] = [(â⇥ x)⇥ â] cos↵+ (â⇥ x) sen↵,
y finalmente expresar el resultado del giro del vector x en la forma
R[↵, â][x] = (x · â)â+ [(â⇥ x)⇥ â] cos↵+ (â⇥ x) sen↵. (2.16)
Propiedad.- El resultado de aplicar consecutivamente a un vector x un giro de
ángulo �↵ y otro de ángulo ↵ respecto a un cierto eje â es el mismo vector x,
esto es, se verifica la relación
R[↵, â][R[�↵, â][x]] = x.
30 Cambios del sistema de referencia: rotaciones
Propiedad.- La rotación de ángulo (�↵) alrededor del eje (�â) es idéntica a la
de ángulo ↵ alrededor del eje â, o lo que es igual, se verifica la relación
R[↵, â][x] = R[�↵,�â][x].
Si aplicamos una rotación de ángulo dado ↵ alrededor de un eje â = a
1
i
1
+
a
2
i
2
+ a
3
i
3
al sistema de referencia I = {i
1
, i
2
, i
3
}, éste se transformará en el sis-
tema F = {f
1
,f
2
,f
3
} de manera que la expresión de los vectores f
j
vendrá dada
por
f
j
= R[↵, â][i
j
].
Particularizando la relación (2.16) con la expresión de â = a
1
i
1
+a
2
i
2
+a
3
i
3
en
la base I, obtendremos las expresiones de los elementos de la base F en términos
de la base I, con lo que podremos calcular la matriz de rotación RIF
0
@
a
2
1 + (a22 + a
2
3) cos↵ a1a2(1� cos↵)� a3 sen↵ a1a3(1� cos↵) + a2 sen↵
a1a2(1� cos↵) + a3 sen↵ a
2
2 + (a21 + a
2
3) cos↵ a2a3(1� cos↵)� a1 sen↵
a1a3(1� cos↵)� a2 sen↵ a2a3(1� cos↵) + a1 sen↵ a
2
3 + (a21 + a
2
2) cos↵
1
A
.
(2.17)
Llamando, como en (2.8), r
ij
a las componentes de esta matriz podemos con-
cluir que se verifican las relaciones:
2 cos↵ = r
11
+ r
22
+ r
33
� 1,
2 a
1
sen↵ = r
32
� r
23
,
2 a
2
sen↵ = r
13
� r
31
,
2 a
3
sen↵ = r
21
� r
12
,
(2.18)
que permiten obtener la rotación alrededor de un eje que pasa de uno a otro
sistema de referencia. Puede observarse que las ecuaciones (2.18) producen dos
soluciones correspondientes a las dos rotaciones de signos opuestos vistas en la
última propiedad.
2.5 Rotaciones elementales
Llamaremos rotación elemental de eje j a aquella que transforma una base
ortonormal I = {i
1
, i
2
, i
3
} en otra también ortonormal F = {f
1
,f
2
,f
3
} mante-
niendo fijo el eje j, esto es i
j
= f
j
. Dichas rotaciones consisten (ver figura 2.2)
en girar el sistema de referencia un cierto ángulo ✓ alrededor del eje definido por
i
j
. La matriz de una rotación de este tipo será llamada R
j
(✓).
Calcularemos únicamente el valor de la matriz R
1
(✓), siendo igual el cálculo
de las otras dos R
2
(✓), R
3
(✓). Para ello tendremos en cuenta que, de acuerdo con
el apartado anterior y la relación (2.16), los vectores de la nueva base {f
1
,f
2
,f
3
}
vendrán dados por las expresiones
f
j
= R[✓, i
1
][i
j
] = (i
j
· i
1
)i
1
+ [(i
1
⇥ i
j
)⇥ i
1
] cos ✓ + (i
1
⇥ i
j
) sen ✓.
Rotaciones elementales 31
i
1
⌘ f
1
i
2
i
3
f
2
f
3
✓
✓
i
1
i
2
⌘ f
2
i
3
f
3
f
1
✓
✓
i
1
i
2
i
3
⌘ f
3
f
1
f
2
✓
✓
Figura 2.2: Rotaciones elementales alrededor de los tres ejes.
De acuerdo con las condiciones de ortonormalidad de la base I y aplicando la
anterior relación a los tres ı́ndices j = 1, 2, 3, se obtendrá:
f
1
= i
1
,
f
2
= cos ✓ i
2
+ sen ✓ i
3
,
f
3
= � sen ✓ i
2
+ cos ✓ i
3
.
(2.19)
Teniendo en cuenta como se forman las matrices de rotación, a partir de las
expresiones de los vectores de la base, la matriz de giro alrededor del eje Ox
podrá expresarse, de acuerdo con los dos convenios establecidos, en la forma:
R
1
(✓) =
0
@
1 0 0
0 cos ✓ � sen ✓
0 sen ✓ cos ✓
1
A , eR
1
(✓) =
0
@
1 0 0
0 cos ✓ sen ✓
0 � sen ✓ cos ✓
1
A . (2.20)
De manera similar pueden obtenerse las matrices de giro elemental respecto
al eje Oy:
R
2
(✓) =
0
@
cos ✓ 0 sen ✓
0 1 0
� sen ✓ 0 cos ✓
1
A , eR
2
(✓) =
0
@
cos ✓ 0 � sen ✓
0 1 0
sen ✓ 0 cos ✓
1
A , (2.21)
y respecto a Oz:
R
3
(✓) =
0
@
cos ✓ � sen ✓ 0
sen ✓ cos ✓ 0
0 0 1
1
A , eR
3
(✓) =
0
@
cos ✓ sen ✓ 0
� sen ✓ cos ✓ 0
0 0 1
1
A . (2.22)
Las matrices anteriores representan, respectivemente, las matrices de rotación
respecto a los tres ejes expresadas en los dos convenios.
A partir de las propiedades de las funciones trigonométricas puede demostrarse
fácilmente la relación
eR
i
(✓) = R
i
(�✓). (2.23)
32 Cambios del sistema de referencia: rotaciones
2.6 Ángulos de Euler
Cualquier rotación de un sistema I = {i
1
, i
2
, i
3
} a otro F = {f
1
,f
2
,f
3
}
puede ser expresada a través de la composición de una serie de giros elementales.
Esta descomposición, que puede ser efectuada de diversas maneras, será presen-
tada aqúı a través de los llamados ángulos de Euler que es su forma más común.
Para ello supondremos que el plano de los vectores i
1
, i
2
es distinto al formado
por f
1
,f
2
. Puesto que el origen O pertenece a ambos planos debe existir una recta
común que estará caracterizada por el vector direccional
i
1
i
3
i
2
f
1
f
2
f
3
l
⌦
I
I✓
Figura 2.3: Ángulos de Euler.
l =
i
3
⇥ f
3
k i
3
⇥ f
3
k .
Como se ve en la figura (2.3) al
ángulo entre el vector i
1
y l le lla-
maremos ⌦. De esta forma si efec-
tuamos una rotación de eje Oz y
ángulo ⌦ pasaremos a un sistema
de referencia I 0 dado por los vecto-
res {l, i
3
⇥ l, i
3
}.
Desde la dirección l, eje Ox del
nuevo sistema de referencia, pode-
mos efectuar un giro de ángulo I,
ángulo entre los vectores i
3
y f
3
,
que pasa al nuevo sistema de refe-
rencia I 00 = {l,f
3
⇥ l,f
3
}, donde
el eje Oz ya coincide con el del sistema F .
Finalmente, llamando ✓ al ángulo que forman las direcciones l con f
1
, podemos
efectuar un giro de eje Oz que pase al sistema de referencia final F = {f
1
,f
2
,f
3
}.
Llamaremos ángulos de Euler a los tres ángulos (⌦, I, ✓) introducidos en los
párrafos anteriores. Por medio de estos ángulos podemos representar cualquier
rotación como composición de las tres rotaciones elementales anteriores en la
forma
xI = R
3
(⌦)R
1
(I)R
3
(✓)xF , (2.24)
o en el segundo convenio
xF = eR
3
(✓) eR
1
(I) eR
3
(⌦)xI .
Esta relación, junto con la propiedad (2.23), permite poner la expresión an-
terior en la forma xF = R
3
(�✓)R
1
(�I)R
3
(�⌦)xI , lo que nos indica que si
(⌦, I, ✓) son los tres ángulos de Euler que pasan de I a F , entonces los ángu-
los (�✓,�I,�⌦) son los ángulos de Euler que pasan de F a I.
Cuando los planos i
1
, i
2
y f
1
,f
2
coincidan el problema es mucho más simple,
pues en estecaso una única rotación alrededor del eje Oz es suficiente para pasar al
Rotaciones y cuaternios 33
sistema de referencia final. Manteniendo la forma de definir los ángulos de Euler
podemos considerar este caso como una rotación de ángulos de Euler (⌦, I =
0�, ✓ = 0�).
Dados dos sistemas de referencia I y F , en los que conocemos las expresiones
de los vectores de la base de F expresados en la base de I, podemos obtener los
ángulos de Euler que pasan de I a F a través de un sencillo algoritmo.
El ángulo ⌦ es la longitud del vector l, o de i
3
⇥f
3
en el sistema de referencia
I, por lo que podemos poner
⌦ = polar
�
((i
3
⇥ f
3
)I ). (2.25)
El ángulo I es el ángulo entre los vectores i
3
y f
3
, luego verifica
I = acos(i
3
· f
3
), (2.26)
expresión que nos da sin ambigüedad este ángulo pues pertenece al intervalo [0,⇡].
Finalmente, el ángulo ✓ es la longitud del vector f
1
en el sistema de referencia
I 00 = {l,f
3
⇥ l,f
3
}, por tanto tendremos
✓ = polar
�
((f
1
)I00 ) = polar
�
( eR
1
(I) eR
3
(⌦)(f
1
)I ). (2.27)
Si tenemos las expresiones de la base de I en términos de la base de F , para
encontrar los ángulos de Euler basta encontrar, por el procedimiento anterior, los
ángulos de Euler que pasan de F a I y cambiarles el signo y el orden.
2.7 Rotaciones y cuaternios
La expresión (2.17), de la matriz RIF que pasa de I a F , puede ponerse,
después de una serie de manipulaciones algebraicas, en la forma2
0
@
q2
0
+ q2
1
� q2
2
� q2
3
2(q
1
q
2
� q
0
q
3
) 2(q
1
q
3
+ q
0
q
2
)
2(q
1
q
2
+ q
0
q
3
) q2
0
� q2
1
+ q2
2
� q2
3
2(q
2
q
3
� q
0
q
1
)
2(q
1
q
3
� q
0
q
2
) 2(q
2
q
3
+ q
0
q
1
) q2
0
� q2
1
� q2
2
+ q2
3
1
A , (2.28)
donde:
q
0
= cos
↵
2
, q
i
= a
i
sen
↵
2
, (2.29)
son llamados parámetros de Euler de la rotación.
El tratamiento de las rotaciones por medio de los parámetros de Euler se
simplifica si se introduce un conjunto de números, desarrollados por Hamilton, y
que son llamados cuaternios.
2En muchos libros aparece la traspuesta de esta matriz porque usan el convenio B.
34 Cambios del sistema de referencia: rotaciones
Los cuaternios son una extensión de los números complejos que se definen a
partir del elemento
q = q
0
+ i q
1
+ j q
2
+ k q
3
, (2.30)
donde se han introducido tres números imaginarios i, j, k, en lugar de uno, cuyos
productos respectivos se definen como:
i2 = j2 = k2 = �1, ij = �ji = k, jk = �kj = i, ki = �ik = j. (2.31)
A q
0
le llamaremos parte real del cuaternio, mientras que el resto será la parte
imaginaria.
Podemos definir la suma, producto por un escalar y el producto de cuaternios
como las operaciones entre polinomios, y aplicar las relaciones (2.31). De esta
forma, dados dos cuaternios cualesquiera qa = qa
0
+ i qa
1
+ j qa
2
+ k qa
3
, qb = qb
0
+
i qb
1
+ j qb
2
+ k qb
3
y un número real r, tendremos
qa + qb = (qa
0
+ qb
0
) + i (qa
1
+ qb
1
) + j (qa
2
+ qb
2
) + k (qa
3
+ qb
3
), (2.32)
para la suma,
r qa = r qa
0
+ i r qa
1
+ j r qa
2
+ k r qa
3
, (2.33)
para el producto por un escalar, y
qaqb = (qa
0
qb
0
� qa
1
qb
1
� qa
2
qb
2
� qa
3
qb
3
)+
i (qa
0
qb
1
+ qa
1
qb
0
+ qa
2
qb
3
� qa
3
qb
2
)+
j (qa
0
qb
2
+ qa
2
qb
0
+ qa
3
qb
1
� qa
1
qb
3
)+
k (qa
0
qb
3
+ qa
3
qb
0
+ qa
1
qb
2
� qa
2
qb
1
),
(2.34)
para el producto.
Estas operaciones dotan al conjunto de los cuaternios de una estructura de
álgebra. Observemos que el producto de dos cuaternios tiene la propiedad asocia-
tiva, pero no la conmutativa.
De forma similar que para los números complejos podemos definir el conjugado
eq de un cuaternio q = q
0
+ i q
1
+ j q
2
+ k q
3
como el cuaternio que tiene la
misma parte real que q pero la parte imaginaria está cambiada de signo, esto
es eq = q
0
� i q
1
� j q
2
� k q
3
.
Para relacionar las rotaciones con los cuaternios estableceremos una relación
entre éstos y los vectores definiendo, a partir de un vector x cuyas componentes en
una cierta base I son (x, y, z), el cuaternio de parte real nula x
� = i x+ j y+ k z.
Con esta definición podemos demostrar, por simple comprobación, que la relación
que nos da el cambio de base de un vector x, que en forma matricial se puede
poner como
xI = RIFxF ,
Rotaciones y cuaternios 35
tiene su equivalente, a partir de un producto de cuaternios3, en la expresión
x
�
I = q x�
F eq, (2.35)
donde q = q
0
+ q
1
i + q
2
j + q
3
k, y (q
o
, q
1
, q
2
, q
3
) representan los parámetros de
Euler de la rotación.
La composición de dos rotaciones que pasan de I
a
a I
b
y de éste a F se
realizarán a partir de dos cuaternios: qa, qb. De esta forma
x
�
Ia
= qa x�
Ib
eqa, x
�
Ib
= qb x�
F
eqb,
por lo que finalmente podremos poner
x
�
Ia
= qaqb x�
F
eqb eqa = q xF eq, q = qaqb. (2.36)
Aśı pues, el cuaternio asociado a la composición de las dos rotaciones viene
dado por el producto de los cuaternios de cada una de las rotaciones en el orden
de aplicación de éstas.
Las rotaciones elementales R
1
(✓), R
2
(✓), R
3
(✓) vienen caracterizadas, respec-
tivamente, por los siguientes cuaternios: (cos ✓/2+ i sen ✓/2), (cos ✓/2+ j sen ✓/2),
(cos ✓/2 + k sen ✓/2).
Por otro lado, si tenemos una rotación definida a partir de los tres ángulos
de Euler ⌦, I, ✓, el cuaternio asociado a esta rotación será el producto de los tres
cuaternios
q = (cos
⌦
2
+ k sen
⌦
2
)(cos
I
2
+ i sen
I
2
)(cos
✓
2
+ k sen
✓
2
),
cuyas componentes son:
q
0
= cos
I
2
cos
⌦+ ✓
2
,
q
1
= sen
I
2
cos
⌦� ✓
2
,
q
2
= sen
I
2
sen
⌦� ✓
2
,
q
3
= cos
I
2
sen
⌦+ ✓
2
.
(2.37)
3En los libros que utilizan el convenio de matrices B, se define como eq x�
q.
36 Cambios del sistema de referencia: rotaciones
Caṕıtulo 3
Fundamentos de los sistemas
de referencia en el espacio
3.1 Introducción
En el caṕıtulo primero se ha establecido que un sistema de referencia está for-
mado por un punto origen O y una base ortonormal directa {i
1
, i
2
, i
3
}. Para
determinar esta base es suficiente, desde el punto de vista práctico, especificar
dos elementos:
El plano fundamental o plano formado por los vectores i
1
e i
2
. Este plano
puede sustituirse por el vector i
3
que es perpendicular al plano fundamental
o bien, si trabajamos en la esfera celeste, por un punto que representa el
polo del sistema o punto intersección del eje i
3
con la esfera.
Una dirección origen de coordenadas representada por el vector i
1
, o bien
el punto de la esfera celeste intersección de ésta con la dirección origen. A
este punto le llamaremos por extensión el origen del sistema.
A partir de estos dos elementos quedan uńıvocamente determinados los vec-
tores i
1
e i
3
, aśı como i
2
, pues la condición de sistema ortonormal directo obliga
a tomar i
2
= i
3
⇥ i
1
.
Observando los fenómenos astronómicos más simples y conocidos se pueden
establecer tres planos que serán la base de los cuatro sistemas de referencia
comúnmente utilizados en Astronomı́a. Estos sistemas, junto con los planetográfi-
cos presentados al final del caṕıtulo, constituyen el fundamento de los sistemas de
38 Fundamentos de los sistemas de referencia en el espacio
referencia en el espacio que serán útiles tanto para el establecimiento de las coor-
denadas astronómicas y geográficas o planetográficas como para el establecimiento
de sistemas de referencia para la navegación espacial.
En los dos próximos caṕıtulos distinguiremos entre los sistemas de referencia
idealizados, que parten de la premisa de que los planos y puntos usados como
referencia están fijos en el espacio, y los sistemas de referencia precisos, que toman
en consideración, de forma rigurosa, las variaciones de estos planos y puntos.
Si atendemos al movimiento orbital de la Tierra en torno al Sol, las leyes
enunciadas por Kepler nos indican que éste tiene lugar en un plano que es llamado
plano de la ecĺıptica.
Por otro lado,la Tierra es un sólido de revolución que gira, con velocidad
angular constante, alrededor de un eje. El plano perpendicular a dicho eje es
llamado plano del ecuador y la intersección del eje de rotación con la superficie
de la Tierra y con la esfera celeste nos define, respectivamente, el polo terrestre
y el polo celeste.
�
✏
ecuador
ecĺıptica
Figura 3.1: Planos del ecuador y de la
ecĺıptica.
Los planos del ecuador y la ecĺıpti-
ca son, en una primera aproximación,
planos fijos en el espacio. Su intersec-
ción (ver figura 3.1), representada por
el śımbolo �, es un punto llamado equi-
noccio1 o punto vernal. El ángulo ✏ en-
tre los dos planos es llamado oblicuidad
de la ecĺıptica y tiene un valor aproxi-
mado de 23�270.
La combinación de la atracción gra-
vitacional junto con la rotación de la
Tierra determinan, para cada observa-
dor situado en su superficie, una di-
rección privilegiada, llamada dirección
vertical, que se observa de manera muy
precisa con una simple plomada. El
plano perpendicular a la vertical de un
lugar es el llamado plano horizontal u
horizonte. Puesto que la dirección de la vertical depende del lugar, el plano
horizontal resulta ser un plano distinto para cada observador.
Mediante estos planos y sus intersecciones definiremos los elementos necesarios
para establecer las bases de los sistemas de referencia fundamentales, pero además,
deberemos establecer el origen del sistema. Utilizaremos distinto nombre según el
origen elegido, aśı llamaremos a los sistemas:
1En realidad existen dos equinoccios: el de primavera o punto en el que el Sol cruza el ecuador
con declinaciones crecientes (acercándose al polo norte) y el equinoccio de otoño, que es el punto
opuesto. De aqúı en adelante cuando hablemos del equinoccio nos referiremos al equinoccio de
primavera.
Sistema de referencia horizontal 39
topocéntrico, si el origen es un lugar en la superficie de la Tierra,
geocéntrico, si el origen es el centro de masas de la Tierra,
heliocéntrico, si el origen es el centro de masas del Sol,
baricéntrico, si el origen es el baricentro del sistema solar,
planetocéntrico, si el origen es el centro de masas de un planeta,
selenocéntrico, si el origen es el centro de masas de la Luna.
El cambio entre sistemas con centros diferentes requerirá aplicar una trasla-
ción, para lo que será necesario el vector de posición relativa entre los dos centros
expresado en la base correspondiente.
Finalmente introduciremos una breve nota relativa a la notación utilizada, de
aqúı en adelante, para dar nombre a los sistemas de referencia. Utilizaremos una
letra mayúscula caligráfica que hará mención, bien al plano fundamental, o bien a
su polo. Un sub́ındice indicará el origen. Aśı, un sistema cuyo plano fundamental
sea el ecuador y origen el equinoccio se representará por E
�
, donde la letra E hace
mención al plano del ecuador, mientras para un sistema cuyo plano fundamental
sea el de la ecĺıptica, y que tenga el mismo origen, usaremos la notación K
�
, que
hace mención al polo de la ecĺıptica en lugar del plano. Puesto que en lo que sigue
se hará hincapié en el cambio de base no se especificará, en general, el origen O
del sistema.
3.2 Sistema de referencia horizontal
Situando un punto de la superficie terrestre como origen del sistema de re-
ferencia, elegiremos su plano horizontal como primer plano fundamental. El eje
ortogonal al plano horizontal (dirección vertical) corta a la esfera celeste en dos
puntos llamados zenit2, Z, y nadir, N . Llamaremos Z
3
al vector unitario que
une el origen con el zenit. Para determinar un sistema de referencia ortonormal
directo a partir Z
3
habrá que fijar las direcciones fundamentales Z
1
y Z
2
sobre
el plano del horizonte.
La Tierra gira alrededor de un eje que une los polos. Para un observador del
hemisferio norte, el polo norte, que puede ser observado cerca de la estrella polar,
señala el Norte geográfico. Debido a la rotación de la Tierra, todos los astros salen
por el horizonte hacia el Este (aunque no exactamente por él), se van elevando
sobre el horizonte, alcanzan su máxima elevación precisamente en la dirección Sur,
y se ponen de nuevo hacia el Oeste (aunque no exactamente por él). Tenemos,
pues, los cuatro puntos cardinales, la dirección Norte–Sur que se puede determinar
fácilmente por observación, y la Este–Oeste perpendicular a la anterior.
2Palabra de origen árabe que significa punto situado sobre nuestra cabeza.
40 Fundamentos de los sistemas de referencia en el espacio
A
h
z
Z
3
Z
2
Z
1
Horizonte
W (Oeste)
S
(Sur)
Figura 3.2: Sistema de referencia horizon-
tal Z
W
. Coordenadas horizontales.
Si llamamos Z
1
al vector unitario
en la dirección Oeste y Z
2
al vector
unitario en la dirección Sur, junto con
la dirección vertical que determina Z
3
,
queda establecida la base que determi-
na el sistema de referencia horizontal.
El origen natural de este sistema es el
lugar de observación, sin embargo, en
ocasiones trasladaremos el origen de di-
cho sistema al centro de masas de la
Tierra. En general, si no hay confusión
con el origen, hablaremos del sistema
Z
W
= {Z
1
,Z
2
,Z
3
}.
Podemos definir las coordenadas
horizontales como las coordenadas po-
lares esféricas en el sistema de referen-
cia horizontal. Llamaremos Acimut3,
A 2 [0, 2⇡), a la colongitud, medida
sobre el horizonte a partir del vector
Z
2
, y distancia cenital, z 2 [0,⇡], a la colatitud, medida a partir del eje Z
3
. Con
esto, si las coordenadas horizontales de un astro son (A, z), su vector de posición
x será
x = sen z senAZ
1
+ sen z cosAZ
2
+ cos zZ
3
, (3.1)
o bien, con la notación introducida en los caṕıtulos anteriores,
xZW
= cart(r,
⇡
2
�A,
⇡
2
� z), (3.2)
donde se ha considerado que el punto está a una distancia r en lugar de tomarlo
en la esfera celeste.
En ocasiones se sustituye la distancia cenital por su complementario (latitud),
y a esta coordenada se le llama altura, o elevación, h = ⇡/2� z.
Dado que se ha tomado como plano fundamental el horizonte y como direccio-
nes fundamentales los puntos cardinales y la vertical, resulta claro que se trata de
un sistema de coordenadas locales, es decir, dependen del punto de la superficie
de la Tierra tomado como origen.
3Esta es la definición usada habitualmente en Astronomı́a y la que mantendremos a lo largo
de este libro porque nos permite una fácil relación con el sistema de referencia horario. En
geodesia, cartograf́ıa y navegación suele medirse desde el Norte y no desde el Sur por lo que
diferirá en 180� de la utilizada aqúı.
Sistema de referencia horario 41
3.3 Sistema de referencia horario
Tomemos de nuevo como origen el observador y definamos un sistema de re-
ferencia en el que el plano del ecuador, o uno paralelo a éste que pase por el
observador, sea el plano fundamental. De esta forma P
3
es el vector unitario en
la dirección del polo norte. La intersección entre el ecuador y el horizonte determi-
na la ĺınea Este–Oeste. Tomamos como vector P
1
el vector unitario en la dirección
Oeste y como vector P
2
el producto P
2
= P
3
⇥P
1
. Con esta definición, los vec-
tores P
1
y Z
1
coinciden. Al sistema E
W
= {P
1
,P
2
,P
3
} le llamaremos sistema
de referencia horario.
H
�
P
3
P
2
P
1
Ecuador
Paralelo
Meridiano
P (Polo norte)
W
Figura 3.3: Sistema de referencia horario
E
W
. Coordenadas horarias.
Los semićırculos máximos que unen
los polos se denominan meridianos. En
particular, al meridiano que contiene
al zenit, es decir, al que contiene los
extremos de los vectores Z
3
y P
3
, se le
llamameridiano del lugar. A los planos
paralelos al ecuador se les conoce como
paralelos.
Las coordenadas polares que deter-
minan la dirección de un astro E en
este sistema de referencia son: el ángu-
lo horario H 2 [0, 2⇡), que represen-
ta la colongitud, y que, por la razón
que expondremos más adelante, se sue-
le expresar en horasy la declinación
� 2 [�⇡/2,⇡/2], que representa la lati-
tud. Con esto, el vector unitario x en
la dirección del punto E es
x = cos � senH P
1
+ cos � cosH P
2
+ sen �P
3
, (3.3)
o también, situando el punto a una distancia r, tendremos
xEW
= cart(r,
⇡
2
�H, �). (3.4)
Debido al movimiento diurno, todos los puntos de la esfera celeste giran alrededor
del eje de los polos, permaneciendo a la misma distancia angular con respecto al
ecuador, esto es, recorriendo un paralelo. De esta forma, su declinación, �, perma-
necerá constante, mientras que el ángulo horario, H, dará una vuelta completa
en un d́ıa; de ah́ı el nombre de “horario” y el que se represente en horas.
Al igual que suced́ıa con las coordenadas horizontales se trata de un sistema
de coordenadas locales puesto que los vectores fundamentales P
1
y P
2
dependen
del lugar elegido.
42 Fundamentos de los sistemas de referencia en el espacio
3.4 Sistema de referencia ecuatorial
↵
�
e
3
e
2
e
1
Ecuador
Paralelo
Meridiano�
P
Figura 3.4: Sistema de referencia E
�
. Coor-
denadas ecuatoriales.
Para que el sistema de referencia no
dependa de la posición del observador
ni del movimiento diurno usaremos de
nuevo el plano del ecuador como plano
fundamental, pero elegiremos como di-
rección origen, esto es como vector e
1
,
la dirección del equinoccio �. El vec-
tor e
3
coincidirá con la dirección del
polo, es decir, e
3
= P
3
y el vector e
2
es el producto e
2
= e
3
⇥ e
1
. Además,
supondremos el origen en el centro de
masas de la Tierra. De esta forma defi-
nimos el sistema de referencia ecuato-
rial E
�
= {e
1
, e
2
, e
3
}.
Las coordenadas polares, longitud
y latitud en este caso, que determinan
la dirección de un astro E en este siste-
ma de referencia, reciben el nombre de:
ascensión recta ↵ 2 [0, 2⇡), que tam-
bién se suele expresar en horas, y declinación � 2 [�⇡/2,⇡/2]. Aśı, el vector
unitario x en la dirección del punto E será
x = cos � cos↵ e
1
+ cos � sen↵ e
2
+ sen � e
3
, (3.5)
o también, situando el punto a una distancia r, tendremos
xE�
= cart(r,↵, �). (3.6)
Se trata, como ya hemos advertido, de un sistema de coordenadas absoluto,
es decir, las coordenadas (↵, �) de un astro son independientes del lugar de obser-
vación y del movimiento diurno, pues el punto � también es arrastrado por dicho
movimiento.
3.5 Sistema de referencia ecĺıptico
La mayor parte de los objetos del sistema solar ocupan posiciones próximas a
la ecĺıptica por lo que, en ocasiones, se suele utilizar otro sistema de coordenadas
cuyo plano fundamental sea la ecĺıptica. Para ello, definimos el sistema de referen-
cia ecĺıptico, K
�
= {K
1
,K
2
,K
3
}, de tal modo que el vector K
1
coincide con la
dirección del equinoccio, K
1
= e
1
, el vector K
3
es la dirección perpendicular a la
ecĺıptica, cuya intersección con la esfera celeste será llamada polo de la ecĺıptica,
y el vector restante el producto K
2
= K
3
⇥K
1
.
Relación entre los sistemas de referencia espaciales 43
�
�
K
3
K
2
K
1
Ecĺıptica
Figura 3.5: Sistema de referencia ecĺıptico
K
�
. Coordenadas ecĺıpticas.
Las coordenadas polares que deter-
minan la dirección de un astro E en es-
te sistema de referencia son: la longitud
ecĺıptica � 2 [0, 2⇡) y la latitud ecĺıpti-
ca � 2 [�⇡/2,⇡/2]. El vector unitario
x en la dirección del punto E es
x = cos� cos�K
1
+
cos� sen�K
2
+
sen�K
3
,
(3.7)
o también, situando el punto a una dis-
tancia r, tendremos
xK�
= cart(r,�,�). (3.8)
Al igual que el sistema ecuatorial, éste
es un sistema de coordenadas absoluto.
En el caso particular del Sol la defi-
nición del plano de la ecĺıptica determi-
na que su latitud ecĺıptica es siempre nula, por ello su posición queda determinada
únicamente por su longitud ecĺıptica que se denota por el śımbolo �.
3.6 Relación entre los sistemas de referencia es-
paciales
P
1
⌘ Z
1
Z
3
Z
2
P
2
P
3
⇡
2
� �
�
Figura 3.6: Transformación entre los siste-
mas horizontal y horario.
Para relacionar los sistemas de re-
ferencia horizontal Z y horario P basta
tener en cuenta que de acuerdo con la
definición de las coordenadas geográfi-
cas, que veremos con detalle en un
próximo apartado de este caṕıtulo, lla-
maremos latitud � de un lugar al ángu-
lo entre la dirección vertical y el ecua-
dor terrestre, que en la figura 3.6 se re-
presenta como el ángulo entre los vec-
tores Z
3
y P
2
.
Observando la figura 3.6 podemos
concluir que para pasar del sistema ho-
rizontal al horario basta girar un ángu-
lo igual a (⇡/2 � �) alrededor del eje
Ox. Por tanto, la matriz de giro entre
estos dos sistemas será
RZW EW
= R
1
(⇡/2� �), (3.9)
44 Fundamentos de los sistemas de referencia en el espacio
y la relación entre las coordenadas en ambos sistemas vendrá dada por la expresión
xZW
= RZW EW
xEW
que, desarrollada, se escribirá en la forma:
sen z senA = cos � senH,
sen z cosA = cos � cosH sen�� sen � cos�,
cos z = cos � cosH cos�+ sen � sen�,
(3.10)
mientras que su inversa, xEW
= REW ZW
xZW
, será:
cos � senH = sen z senA,
cos � cosH = sen z cosA sen�+ cos z cos�,
sen � = � sen z cosA cos�+ cos z sen�.
(3.11)
Para establecer la relación entre los sistemas horario y ecuatorial tengamos
en cuenta la figura 3.7. Habitualmente se llama tiempo sidéreo, ST , al ángulo
horario del equinoccio �. Este ángulo vaŕıa, por la rotación de la Tierra, entre 0h
y 24h a lo largo de un d́ıa por lo que representa el reloj natural de la Astronomı́a.
P
3
⌘ e
3
e
1
(�)
�
P
2
(Sur)
Sur
H
↵
ST
H
↵
ST
L
L
Figura 3.7: Transformación entre los sistemas horario y ecuatorial.
Para pasar del sistema horario al ecuatorial debemos girar alrededor de P
3
o
eje Oz el ángulo entre P
1
y e
1
, esto es ⇡/2� ST . La matriz de giro entre ambos
sistemas será
REW E�
= R
3
(⇡/2� ST ). (3.12)
La relación entre las coordenadas puede obtenerse, bien por la expresión xE�
=
RE�EW
xEW
, o bien, teniendo en cuenta que la declinación es común en ambos
sistemas, basta observar la figura 3.7 para comprobar que
ST = ↵+H. (3.13)
Sistema de referencia geográfico 45
e
1
⌘K
1
e
3
e
2
K
2
K
3
✏
Figura 3.8: Transformación entre los
sistemas ecuatorial y ecĺıptico.
Finalmente, para relacionar el sistema
ecuatorial con el ecĺıptico basta recordar
que la oblicuidad de la ecĺıptica ✏ es el
ángulo entre los planos del ecuador y la
ecĺıptica y, por tanto, también entre los
vectores e
3
y K
3
(figura 3.8). Si tenemos
esto en cuenta, aśı como el hecho de que
los vectores e
1
y K
1
coinciden, podemos
concluir que el paso del sistema ecuatorial
al ecĺıptico se realiza por una rotación ele-
mental de ángulo ✏ alrededor del eje Ox,
o lo que es igual, por medio de una matriz
de rotación
RE�K�
= R
1
(✏). (3.14)
La relación entre las coordenadas en
ambos sistemas vendrá dada por la expresión xE�
= RE�K�
xK�
que, desarrollada,
se escribirá en la forma:
cos � cos↵ = cos� cos�,
cos � sen↵ = cos� sen� cos "� sen� sen ",
sen � = cos� sen� sen "+ sen� cos ",
(3.15)
mientras que la relación inversa será:
cos� cos� = cos � cos↵,
cos� sen� = cos � sen↵ cos "+ sen � sen ",
sen� = � cos � sen↵ sen "+ sen � cos ".
(3.16)
3.7 Sistema de referencia geográfico
Estudiando la figura que adopta un fluido en rotación en ausencia de fuerzas
externas se comprueba que una de las posibles soluciones es un elipsoide de re-
volución achatado por los polos. De hecho, se ha comprobado que esta figura se
aproxima mucho a la forma real no solo de la Tierra son de otros cuerpos como
la Luna, Marte u otros planetas. Además, en todos los casos, el eje de simetŕıa de
este elipsoide de revolución está tan próximo al eje de rotación del planeta que,
en una primera aproximación, pueden considerarse idénticos.
La necesidad de situar geográficamente puntos sobre la superficie de la Tierra
ha llevado a definir un sistema de coordenadas geográficas sobreel elipsoide.
La inclusión del concepto de altitud, para representar puntos de la Tierra que
no se encuentren exactamente en el elipsoide, permite extender el uso de estas
coordenadas geográficas para la determinación de la posición geográfica de los
satélites artificiales.
46 Fundamentos de los sistemas de referencia en el espacio
Para introducir unas coordenadas geográficas estableceremos un sistema de
referencia G = {T, g
1
, g
2
, g
3
}, que llamaremos sistema de referencia geográfico4,
donde T representa el centro de masas de la Tierra y g
3
el eje de revolución del
elipsoide que también llamaremos eje polar pues por el momento supondremos
que coincide con el eje de rotación del planeta. Por extensión el plano de g
2
y g
3
será el ecuador. Finalmente debemos elegir un meridiano cero también llamado
meridiano de referencia o primer meridiano, tradicionalmente el meridiano de
Greenwich. Este meridiano de referencia fija la posición del vector g
1
y por tanto
la de g
2
= g
3
⇥ g
1
. Las dimensiones del elipsoide quedan caracterizadas por un
parámetro a que representa el radio ecuatorial del elipsoide y por el achatamiento
f = (a� b)/a, donde b es llamado radio polar.
La combinación de la atracción gravitacional junto con la rotación de la Tierra
determinan, para cada observador en la superficie, la dirección vertical de la que
ya hemos hablado antes. Sin embargo, esta dirección no coincide exactamente con
la normal al elipsoide de revolución en un punto, presentando desviaciones que
han de ser determinadas para poder pasar de un sistema a otro. En el caso de la
Tierra las desviaciones son del orden de 500 a 1000, por lo que para la mayoŕıa de
aplicaciones astronómicas y astrodinámicas podemos prescindir de estas pequeñas
diferencias y supondremos que la normal al elipsoide y la dirección de la plomada
coinciden.
g
1
g
2
g
3
�
�
S
a
T a
b
b
a
�
⇢
x
z
⇠
S
P
Figura 3.9: Sistema de referencia geográfico.
Veamos cómo podemos situar un punto S sobre las superficie del elipsoide. Las
coordenadas polares esféricas de ese punto serán (⇢,�, ), donde ⇢ es la distancia
radial al centro de la Tierra, la longitud geográfica � es el ángulo diedro que forma
el meridiano de referencia con el meridiano del punto S. La longitud, que suele
expresarse en horas, será tomada, de aqúı en adelante, como un ángulo entre 0h y
4En este sistema hemos usado un śımbolo G independiente del polo, del ecuador y del origen,
pues estos puntos en el caso del elipsoide de referencia terrestre deberán ser redefinidos con más
cuidado.
Sistema de referencia geográfico 47
24h medido en sentido contrario a las agujas del reloj, lo que en la Tierra supone
medirlo hacia el este. Habitualmente, cuando se da la posición geográfica de un
lugar de la Tierra, suele utilizarse el convenio de dar el ángulo entre 0h y 12h hacia
el este o el oeste, por lo que cuando se da longitud oeste será preciso cambiarle el
signo y sumarle 24h para aplicar el convenio usado en este libro.
Para determinar la latitud observaremos la figura de la derecha de 3.9, que
representa la elipse meridiana, esto es, la intersección del plano del meridiano del
lugar S con el elipsoide de referencia. Aqúı distinguiremos dos puntos: el punto S
del elipsoide del que estamos definiendo las coordenadas y un punto P que está a
una distancia ⇠ de S sobre la vertical de éste. A ⇠ le llamaremos altitud de P .
Definiremos en primer lugar las coordenadas de S y luego veremos como afecta
en las coordenadas el hecho habitual de que el punto de la superficie de la Tierra,
cuyas coordenadas se miden, no esté exactamente sobre en el elipsoide sino a una
altitud ⇠ respecto a éste.
El ángulo , denominado latitud geocéntrica, es el ángulo formado por el se-
mieje mayor de la elipse meridiana con el radio que pasa por el punto S. Sin em-
bargo, en coordenadas astronómicas suele emplearse la llamada latitud geográfica,
de śımbolo �, que es el ángulo formado por la normal a la elipse meridiana en el
punto S (que como hemos mencionado anteriormente, haremos coincidir con la
dirección de la plomada) con el semieje mayor de dicha elipse. Las dos longitudes
,� 2 [�⇡/2,⇡/2], aunque se suelen expresar siempre como cantidades positivas
indicando si es latitud norte (N) o sur (S).
Para establecer la relación entre ambas latitudes consideraremos un sistema
de referencia plano en la elipse meridiana cuyos ejes Ox y Oz coinciden con la
dirección de los semiejes mayor y menor de la elipse. En este sistema la ecuación
de la elipse meridiana se puede poner como
x2
a2
+
z2
b2
= 1.
La pendiente de la recta normal a la elipse es
tan� = �dx
dz
=
a2z
b2x
,
mientras que el ángulo viene dado por tan = z/x, con lo que resulta
tan� =
1
1� e2
tan , (3.17)
siendo e la excentricidad del elipsoide que se obtiene a partir del radio ecuatorial
a y el achatamiento f .
El radio vector ⇢ se obtiene también sin dificultad, aunque con un poco más
de cálculo. A partir de la ecuación de la elipse,
b2x2 + a2z2 = a2b2,
48 Fundamentos de los sistemas de referencia en el espacio
y teniendo en cuenta que
x = ⇢ cos , z = ⇢ sen ,
se tiene
⇢2 =
a2b2
b2 cos2 + a2 sen2
=
a2(1� e2)
1� e2 cos2
. (3.18)
Por otra parte, al ser b2x sen� = a2z cos�, resulta
x2 =
a4z2 cos2 �
b4 sen2 �
, y de ah́ı, z2 =
b4 sen2 �
a2 cos2 �+ b2 sen2 �
,
y con esto
⇢2 = x2 + z2 =
a2[cos2 �+ (1� e2)2 sen2 �]
1� e2 sen2 �
. (3.19)
Ahora bien, normalmente los lugares de observación no se encuentran sobre el
elipsoide de referencia, sino a una cierta altitud, por eso se hace necesario el ob-
tener las coordenadas de un lugar P situado a una altitud ⇠ sobre el horizonte.
Recordemos que la latitud se mide sobre la normal al elipsoide. Por ello, se in-
troducen unas cantidades C y S de modo que las coordenadas del punto resultan
ser:
x = ⇢ cos = aC cos�,
z = ⇢ sen = aS sen�.
(3.20)
Dividiendo estas dos ecuaciones, se tiene
S
C
tan� = tan =
b2
a2
tan� = (1� f)2 tan�,
lo que, llevado a la ecuación de la elipse, nos da
1 =
x2
a2
+
z2
b2
= C2[cos2 �+ (1� f)2 sen2 �)],
de donde se obtiene finalmente:
C = 1/
p
1� f(2� f) sen2 �, S = C(1� f)2.
Con esto, si el punto P 0 se encuentra a una altitud ⇠ tendremos
x0 = x+�x = (aC + ⇠) cos�,
z0 = z +�z = (aS + ⇠) sen�,
(3.21)
siendo x0, z0 sus coordenadas sobre el plano del meridiano del observador.
A partir de lo dicho hasta ahora podemos llamar coordenadas geográficas de
un punto al conjunto de elementos (�,�, ⇠) que describe su posición con respecto
al elipsoide de referencia. Teniendo en cuenta todo lo anterior la expresión del
Sistema de referencia geográfico 49
vector de posición de este punto, xG , expresado en el sistema de referencia G,
vendrá dada por
xG =
0
@
(aC + ⇠) cos� cos�
(aC + ⇠) cos� sen�
(aS + ⇠) sen�
1
A . (3.22)
En el caso de la Tierra, el IERS (International Earth Rotation and Reference
System Service) ha definido el ITRS (International Terrestrial Reference System)
como el elipsoide de referencia terrestre oficial. Tras muchos años de estudio de la
forma de la Tierra, y una necesidad cada vez más imperiosa de precisión, se han
modificado muchos de los estándares clásicos y se ha creado este marco teórico
preciso que se debe materializar en modelos calculados que se adapten a este
sistema.
El ITRS es un modelo de elipsoide cuyo polo es el llamado IRP (Polo de
referencia del IERS) y cuyo meridiano cero es el llamado IRM (Meridiano de
referencia del IERS). Este sistema se ha creado de forma que sea consistente
con el modelo del BIH de 1984, con el polo ajustado al antiguo CIO (Origen
internacional convencional) que ha sido suprimido. De acuerdo con el convenio de
notación establecido antes el sistema de referencia asociado a este modelo debeŕıa
llamarse IRP
IRM
sin embargo, por claridad, hemos preferido continuar usando
para este sistema el śımbolo G.
Una materialización de este sistema es el actual elipsoideWGS84 (World
Geodetic System 1984) que es el modelo donde se representan las coordenadas
emitidas por los satélites GPS. Debido a la importancia de esta información usa-
remos de aqúı en adelante este modelo como modelo de la Tierra. El modelo
WGS84 es consistente con ITRS con una aproximación de unos pocos cent́ıme-
tros, por lo que será suficiente para todas nuestras aplicaciones.
Los parámetros de dicho modelo se caracterizan por los siguientes elementos:
el radio ecuatorial, que de aqúı en adelante se denotará por r� en lugar de a, y
que vale r� = 6378137 m, y f = 1/298.257223563. De esta forma el radio polar
mide 6356752.3142 m. El meridiano de referencia IRM no coincide exactamente
con el meridiano de Greenwich sino que está desplazado unos 100 m. hacia el este.
Cuando las coordenadas de un lugar no se obtienen con GPS sino a partir de
los modelos geodésicos de cada páıs o región no se usa el modelo WGS84 sino que
se usan modelos regionales mucho más precisos para una zona determinada pero
que no son consistentes para la globalidad del globo terrestre. El modelo Español
está integrado en el modelo Europeo ED50, y en él se dan todas las coordena-
das geográficas oficiales. Existen métodos sencillos que permiten transformar las
coordenadas entre ambos sistemas que no vamos a ver aqúı porque exceden del
propósito de este libro. El modelo llamado ETRS89 es una adaptación europea
al modelo ITRS, o bien al WGS84.
50 Fundamentos de los sistemas de referencia en el espacio
3.8 Sistema de referencia planetográfico
Teniendo en cuenta la posibilidad futura de enviar misiones, tanto a la Luna
como a Marte, y aprovechando que la forma de dichos cuerpos es, como en el
caso de la Tierra, un elipsoide de revolución, estableceremos un sistema genérico
de coordenadas que llamaremos coordenadas planetográficas, que serán llamadas
selenográficas en el caso de la Luna y areográficas en el caso de Marte5 y que en
esencia son idénticas a las establecidas para la Tierra.
p
1
p
2
p
3
�
�
a
b
P
S
polo del planeta
ecuador del planeta
Figura 3.10: Sistema de referencia plane-
tográfico.
El sistema de referencia donde
se definirán las coordenadas pla-
netográficas será llamado sistema
de referencia planetográfico P =
{P,p
1
,p
2
,p
3
}, donde p
3
representa
el eje de revolución que también lla-
maremos eje polar pues supondre-
mos que coincide con el eje de rota-
ción del planeta6. A la intersección
del eje de revolución y de rotación
con la superficie del elipsoide le lla-
maremos polo del planeta. El plano
de los vectores p
1
,p
2
será llamado,
por extensión, ecuador del planeta.
Finalmente debemos elegir unmeri-
diano cero o primer meridiano. Es-
te meridiano de referencia fija la po-
sición del vector p
1
y por tanto la
de p
2
= p
3
⇥ p
1
.
En el caso de la Luna los valores que determinan el elipsoide son a = 1738.1 km,
f = 0.0012, por lo que el radio polar será b = 1736.0 km. El primer meridiano
está situado casi en centro de la cara visible y su velocidad de rotación, que
determinará la posición del meridiano cero desde una dirección fija, es de una
vuelta cada 27.321661 d́ıas.
Para Marte se tiene un radio ecuatorial de a = 3397 km y un achatamiento
de f = 0.00736. El primer meridiano pasa por el crater Airy-0 y tiene un peŕıodo
de rotación de 1.025957 d́ıas.
Una vez creado el sistema planetográfico, donde podremos establecer la topo-
graf́ıa del planeta, será necesaria la relación de éste con un sistema fijo como el
ecuatorial a través de un sistema intermedio que llamaremos planetocéntrico.
La forma usual de definir los elementos del sistema planetográfico P = {P,p
1
,
p
2
, p
3
} con respecto al sistema ecuatorial E
�
= {P, e
1
, e
2
, e
3
} es definir las coorde-
nadas ecuatoriales del polo del planeta, (↵
0
, �
0
), y determinar lo que llamaremos
5Ares es el nombre griego de Marte.
6El plano del ecuador de un planeta no coincide con el plano del ecuador terrestre.
Sistema de referencia planetográfico 51
ángulo de rotación, W , que forma el vector p
1
con respecto a la intersección
del ecuador del planeta con el ecuador celeste. Comprobaremos a continuación
que estos tres parámetros permiten efectuar el cambio entre los dos sistemas de
referencia anteriores.
p
1
p
3
e
1
e
3
⇡
2
� �
0
⇡
2
+ ↵
0
WP
�
�
$
Figura 3.11: Movimiento del sistema plane-
tográfico respecto al sistema ecuatorial.
Suponiendo que el planeta ro-
ta con velocidad angular constan-
te alrededor de su eje de rotación,
el ángulo de rotación representa la
posición instantánea del meridiano
principal con respecto a una posi-
ción fija. Este ángulo, que es en
cierto modo equivalente al tiempo
sidéreo en la Tierra, podrá poner-
se como W = W
0
+ tW
r
, donde W
0
representa el valor del ángulo en un
cierto instante origen, t es el tiempo
transcurrido desde ese instante ori-
gen medido en d́ıas, y W
r
es igual
a 2⇡/P
r
siendo P
r
el periodo de ro-
tación del planeta en d́ıas.
Llamaremos $ y � a los puntos
del ecuador del planeta que repre-
sentan los extremos de los vectores
p
1
y P
1
= (e
3
⇥ p
3
)/k e
3
⇥ p
3
k. Este último determina la intersección del ecua-
dor celeste y el del planeta y representa el primer meridiano o meridiano cero
del planeta. De esta forma podemos definir dos sistemas de referencia asociados
a la rotación del planeta, por un lado el que hab́ıamos llamado antes sistema
planetográfico {P,p
1
,p
2
,p
3
}, similar al geográfico en la Tierra, que es un sis-
tema que rota con el planeta y que de ahora en adelante denotaremos por el
śımbolo P
$
y otro sistema que llamaremos sistema de referencia planetocéntrico
P
�
= {P,P
1
,P
2
,P
3
}, con P
3
= p
3
y P
2
= P
3
⇥P
1
, que es un sistema fijo pero
cuyo plano fundamental coincide con el ecuador del planeta.
Si (↵
0
, �
0
) representan las coordenadas del polo del planeta podremos poner
p
3
= cos↵
0
cos �
0
e
1
+ sen↵
0
cos �
0
e
3
+ sen �
0
e
3
,
por lo que podemos deducir fácilmente que
P
1
= (e
3
⇥ p
3
)/k e
3
⇥ p
3
k = � sen↵
0
e
1
+ cos↵
0
e
2
,
lo que equivale a decir que la ascensión recta de del punto � vale (⇡/2+↵
0
), como
se muestra en la figura 3.11.
La inclinación entre los dos ecuadores viene dada por el ángulo entre los vec-
tores e
3
y p
3
que es igual a (⇡/2� �
0
).
52 Fundamentos de los sistemas de referencia en el espacio
Con todo ésto podemos deducir que los ángulos de Euler que pasan del sistema
E
�
a P
$
son (⇡/2+↵
0
,⇡/2� �
0
,W ) por lo que la matriz de rotación entre ambos
sistemas será
RE�P$
= R
3
(⇡/2 + ↵
0
)R
1
(⇡/2� �
0
)R
3
(W ), (3.23)
y la matriz de paso de E
�
a P
�
será simplemente
RE�P�
= R
3
(⇡/2 + ↵
0
)R
1
(⇡/2� �
0
). (3.24)
En el informe de G. Seidelmann et al.7 (2007) aparecen los valores de los
elementos (↵
0
, �
0
,W ) para todos los planetas, la Luna y otros cuerpos del sistema
solar obtenidos por el grupo de trabajo formado por la IAU para el estudio de la
rotación de los planetas.
7Ver bibliograf́ıa.
Caṕıtulo 4
Sistemas de referencia
espaciales precisos
4.1 Movimientos del polo y del equinoccio
Al introducir los sistemas de referencia espaciales en el caṕıtulo anterior se
ha supuesto que el ecuador y la ecĺıptica son planos fijos y, por tanto, que el
equinoccio representa un punto fijo en la esfera celeste. Además, para definir las
coordenadas geográficas y planetográficas hemos considerado que el eje de rotación
del planeta, que define su polo y su ecuador, y el eje de revolución del elipsoide
de referencia del planeta coinciden. La realidad es que ninguna de las premisas
anteriores es cierta por lo que deben detallarse mucho más las definiciones a la
hora de definir sistemas de referencia que cumplan los requerimientos de precisión
de la Astrometŕıa y Astrodinámica actuales.
Para entender el problema debemos comprender mejor el movimientode ro-
tación de los planetas. Supondremos, como primera aproximación, que éstos son
sólidos ŕıgidos, cuyo movimiento rotacional se describe por las ecuaciones de Euler
del movimiento del sólido:
I
1
!̇
1
+ (I
3
� I
2
)!
2
!
3
= µ
1
,
I
2
!̇
2
+ (I
1
� I
3
)!
1
!
3
= µ
2
,
I
3
!̇
3
+ (I
2
� I
1
)!
1
!
2
= µ
3
,
(4.1)
donde I
1
, I
2
, I
3
son los momentos principales de inercia del sólido, y ! = !
1
p
1
+
!
2
p
2
+!
3
p
3
es el vector velocidad angular de rotación del sólido expresada en el
sistema de referencia planetográfico P = {p
1
,p
2
,p
3
}, que supondremos coincide
54 Sistemas de referencia espaciales precisos
con el de ejes principales de inercia. Finalmente µ
1
p
1
+ µ
2
p
2
+ µ
3
p
3
representa
el momento de las fuerzas externas que actúan sobre el sólido.
La integración de las ecuaciones anteriores determinará el valor del vector !.
Una vez obtenido éste podremos decir que el sólido rota con una velocidad angular
! = k! k alrededor de un eje cuya dirección coincide con la dirección !̂ del vector
!.
Si suponemos que no actúa ninguna fuerza exterior sobre el sólido (µ
1
= µ
2
=
µ
3
= 0) y que éste es de revolución alrededor del eje Oz (I
1
= I
2
), las ecuaciones
de Euler (4.1) se transforman en:
I
1
!̇
1
+ (I
3
� I
1
)!
2
!
3
= 0,
I
1
!̇
2
+ (I
1
� I
3
)!
1
!
3
= 0,
I
3
!̇
3
= 0.
(4.2)
De la tercera de estas ecuaciones se obtiene inmediatamente que
!
3
= ⌦ = constante. (4.3)
p
1
p
3
p
2
!
Figura 4.1: Movimiento del eje de rotación
de un sólido libre.
Las dos primeras ecuaciones (4.2)
se pueden escribir como:
!̇
1
+ �
E
!
2
= 0,
!̇
2
� �
E
!
1
= 0,
donde hemos introducido la constante
�
E
=
I
3
� I
1
I
1
⌦.
La solución de estas ecuaciones será
!
1
= A cos(�
E
t+B),
!
2
= A sen(�
E
t+B),
(4.4)
donde A, la fase, y B, la amplitud,
son constantes de integración.
Las expresiones (4.3) y (4.4) deter-
minan la velocidad angular de un pla-
neta, considerando éste como un elip-
soide ŕıgido y sobre el que no actúan
fuerzas externas. El valor constante de A y ⌦ nos indica que la norma de la
velocidad angular ! =
p
A2 + ⌦2 es una constante, mientras que su dirección
describe un cono alrededor del eje p
3
, tal como se observa en la figura 4.1. Por
ello, podemos decir que, en estas condiciones, un planeta gira con velocidad angu-
lar constante alrededor de un eje que describe un cono en torno al eje de simetŕıa
del elipsoide. De esta forma vemos que el polo del planeta, esto es, el extremo del
eje de rotación, no coincide con el polo del sistema planetocéntrico.
Movimientos del polo y del equinoccio 55
En el caso de la Tierra, los valores de I
1
, I
2
, I
3
verifican, aproximadamente,
la relación (I
3
� I
1
)/I
1
⇡ 2 ⇥ 10�5. Con estos valores el periodo de rotación
alrededor del eje de simetŕıa es de unos 304 d́ıas, mientras que el valor de A es
muy pequeño, de forma que la distancia angular entre la posición del polo de
sistema planetográfico, extremo de p
3
, y el polo de rotación, extremo de !, no es
mayor que 0.002, lo que equivale a decir que la separación de estos dos puntos en la
superficie terrestre nunca es mayor de 10 m. De acuerdo con la definición de d́ıa,
como el periodo de tiempo en que la Tierra da una vuelta alrededor de su eje de
rotación, se tendrá que el valor de ! es exactamente de 2⇡ radianes por d́ıa.
Chandler observó, en 1891, que el periodo de 304 d́ıas del eje de rotación,
llamado en su honor periodo de Chandler, es realmente de unos 433 d́ıas. Esta
discrepancia se debe al hecho de que la Tierra no es completamente ŕıgida, sino
que tiene deformaciones elásticas. Además, también se observan fluctuaciones de
periodo anual debidas a los cambios estacionales en la distribución de masas de
aire, de aguas, deshielos, etc., e incluso variaciones irregulares, debidas a terre-
motos, volcanes, etc., es decir, a un cambio en la distribución de masas de la
Tierra.
Por otro lado, hemos estudiado una aproximación del problema real, pues no
se han considerado los valores de las componentes, (µ
1
, µ
2
, µ
3
), del momento de
las fuerzas producidas por el Sol, la Luna y los planetas.
Figura 4.2: Gráfica del movimiento del polo. Datos del IERS.
La gráfica 4.2 muestra los datos de movimiento del polo obtenidos por el IERS
(International Earth Rotation and Reference Systems Service) para el peŕıodo
56 Sistemas de referencia espaciales precisos
comprendido entre 1890 y 2000, donde se da el desplazamiento, en segundos de
arco, en el plano horizontal con centro en el polo del sistema de coordenadas
geográfico y cuyo eje OX representa la dirección del meridiano cero de este siste-
ma.
Estos puntos representan el polo verdadero de rotación de la Tierra en cada
instante y en consecuencia el ecuador verdadero de cada fecha. Incluyen todos los
efectos que actúan sobre el eje de rotación y no pueden ser previstos a priori, sino
que se calculan por observación. El IERS es el organismo internacional encargado
del cálculo y distribución de estos datos.
Hasta aqúı se ha considerado únicamente la variación del eje de rotación te-
rrestre debida al movimiento del sólido libre. Esta variación se ha representado a
través del movimiento del polo y se ha referido al sistema sistema geográfico, soli-
dario con el planeta. La variación del eje de rotación debida al efecto gravitacional
del Sol y la Luna, por un lado, y de los planetas por otro, se estudia a través del
movimiento del plano del ecuador, más concretamente a través del movimiento
del equinoccio, y se refiere a un sistema espacial en lugar del sistema geográfico.
Hiparco observó que el equinoccio se desplazaba sobre la ecĺıptica con un
movimiento retrógrado de 2� cada 144 años, o lo que es igual, de 50.002 por año.
Este desplazamiento fue llamado precesión de los equinoccios. Este fenómeno,
debido en parte a la variación del plano del ecuador, tiene como consecuencia el
desplazamiento del polo norte celeste, que completa una vuelta alrededor del polo
de la ecĺıptica en unos 26000 años.
El problema de la rotación de la Tierra, considerando todos los elementos
que influyen en esta rotación, es uno de los más dif́ıciles de la Mecánica Celeste.
Esta complejidad es debida, sobre todo, a la falta de esfericidad de la Tierra y a
que tanto el Sol, la Luna, como los planetas se mueven en órbitas cuyos elementos
orbitales no se pueden expresar en forma cerrada, es decir, por medio de funciones
elementales. La solución de las ecuaciones diferenciales que rigen este movimiento
solamente se puede conocer mediante desarrollos en serie del tipo
q
j
=
1
X
i=0
s
i
ti +
1
X
i=0
1
X
k=0
m
k
tk
!
✓
sen
cos
◆
(c
i
t+ d),
es decir, como suma de términos seculares (series de potencias en t) y términos
mixtos (combinación de términos seculares y periódicos). Pues bien, los términos
seculares son los responsables de la precesión, mientras que los periódicos y mix-
tos lo son de la nutación, término cuya ráız latina nutare significa cabeceo1. En
este libro no estudiaremos la obtención de estas magnitudes, sino el efecto que
producen en los sistemas de referencia espaciales.
1Véase la sección 12.4 de este libro para una descripción de los distintos tipos de pertur-
baciones. La precesión se corresponde con las perturbaciones de largo periodo, mientras que la
nutación es una perturbación de corto periodo.
Sistemas de referencia espaciales precisos 57
Tanto el ecuador como la ecĺıptica se mueven. Al ecuador en un cierto instante,
que representaremos por E , se le llama actualmente ecuador intermedio, aunque
ha sido llamado también ecuador verdadero, ecuador aparente o ecuador de la
fecha2. A la intersección del ecuador intermedio con la ecĺıptica de la fecha se le
llama equinoccio verdadero de la fecha o simplemente equinoccio de la fecha y se
representa por �, mientras que el ángulo entre estos dos planoses la oblicuidad
verdadera de la fecha, ✏0.
E
Em
ecĺıptica
�
�
m
�0
m
✏0
✏
Figura 4.3: Precesión y nutación.
El ecuador intermedio o verdade-
ro se obtiene corrigiendo por prece-
sión y nutación el ecuador de un ins-
tante inicial. Si solamente corregimos
por precesión, es decir, prescindimos
de las variaciones periódicas que son
mucho más pequeñas que las debidas
a la precesión, obtenemos otro plano,
próximo al ecuador verdadero, que se
llama ecuador medio y se representa
por Em. La intersección de la ecĺıptica
con el ecuador medio se llama equi-
noccio medio, �
m
, y el ángulo entre
los dos planos oblicuidad media, ✏.
La nutación establece la posición
relativa en el espacio de los puntos �
y �
m
, aśı como de la diferencia entre
las oblicuidades ✏ y ✏0. Por otro lado, el punto �
m
da, por el efecto de precesión,
una vuelta completa al ecuador medio en un periodo de unos 26000 años.
Los puntos � y �
m
pertenecen a planos ecuatoriales distintos, sin embargo, en
ocasiones se habla de un punto llamado, por extensión, equinoccio medio, �0
m
en
la figura (4.3), que es un punto del ecuador verdadero que pertenece al mismo
meridiano que el equinoccio medio �
m
.
4.2 Sistemas de referencia espaciales precisos
La aparición del fenómeno de precesión-nutación obliga a una definición pre-
cisa de los sistemas de referencia basados en el ecuador. Podemos definir varios
sistemas asociados a éste:
Sistema ecuatorial verdadero de la fecha, E
�
= {e�
1
, e�
2
, e�
3
}. Este sistema
está basado en el ecuador intermedio y el equinoccio, �, de la fecha.
2De aqúı en adelante usaremos indistintamente las palabras ...de la fecha o ...de la época
para designar un elemento que depende de un instante dado.
58 Sistemas de referencia espaciales precisos
Sistema ecuatorial medio, Em
�m
= {em
1
, em
2
, em
3
}. Es el sistema referido al
ecuador y equinoccio medios. Es el sistema verdadero sin corregir por nuta-
ción.
Sistema ecuatorial de la época J2000.03, Eo
�o
= {eo
1
, eo
2
, eo
3
}. Este sistema es
un sistema fijo definido a partir de la posición del ecuador y el equinoccio
medios en un instante determinado, concretamente J2000.0. A partir de este
sistema una corrección por precesión nos lleva al sistema Em
�m
, mientras que
una corrección por precesión y nutación nos lleva a E
�
.
Sistema de ecuador verdadero–equinoccio medio, E
�
0
m
, que tiene como plano
fundamental el plano del ecuador verdadero y como origen el punto �0
m
.
A las coordenadas ecuatoriales, medidas en cada uno de los tres primeros
sistemas, se les da el nombre de coordenadas verdaderas, coordenadas medias y
coordenadas de la época J2000.0.
Para disponer de un sistema de referencia fijo, donde un objeto celeste sin
movimiento propio tenga unas coordenadas constantes, y que sirva como sistema
inercial al plantear las ecuaciones del movimiento de los cuerpos celestes, se defi-
nió con precisión el sistema ecuatorial Eo
�o
, que se materializó en la obtención del
catálogo FK5, que no es sino el conjunto de las posiciones de una serie de objetos
celestes medidas con una gran precisión y referidas a Eo
�o
. La comparación de las
posiciones de otros objetos celestes con los del catálogo FK5 permite calcular las
coordenadas precisas de dicho objeto.
La Unión Astronómica Internacional, teniendo en cuenta la necesidad de una
precisión mucho mayor que la obtenida con el uso del sistema Eo
�o
, estudió entre los
años 1991 y 2000 una serie de cambios en la definición de los sistemas de referencia
para hacerlos más rigurosos y precisos. Estos cambios fueros establecidos y están
en vigor desde el año 2003.
En primer lugar, de la misma forma que hace unos años en el tema de la medida
del tiempo, se ha partido de una concepción de los sistemas de referencia basada
en la teoŕıa de la relatividad, lo que conduce a dos tipos de sistemas distintos:
el sistema de referencia baricéntrico celeste, BCRS y el sistema de referencia
geocéntrico celeste, GCRS. Ambos sistemas, definidos dentro del contexto de la
teoŕıa de la relatividad en la geometŕıa del espacio tiempo 4-dimensional, son dos
sistemas centrados respectivamente en el baricentro del sistema solar y en el de
la Tierra y con su tiempo propio, el tiempo coordenada baricéntrico TCB y el
tiempo coordenada geocéntrico TCG . Ambos difieren fundamentalmente en el
origen, pues sus ejes, que constituirán un sistema ortogonal directo, son paralelos
y llevan direcciones fijas en el espacio4.
3El instante o época J2000.0 corresponde al d́ıa 1 de enero de 2000 a las 12h TT y será ex-
plicado con detalle en el próximo caṕıtulo.
4Están definidos como cinemáticamente no rotantes, lo que significa que sus ejes no tienen
rotación sistemática con respecto a objetos muy distantes en el universo sin movimiento propio.
Sistemas de referencia espaciales precisos 59
Aunque la orientación de los ejes en la definición del sistema BCRS no está de-
finida formalmente, estos ejes coinciden con los del sistema llamado
Sistema de referencia celeste internacional, ICRS,
cuya materialización práctica, al igual que el FK5 lo era del sistema Eo
�o
, viene
dada por el ICRF5, que no es sino el conjunto de posiciones de un gran número
de radiofuentes extragalácticas. Los ejes de este sistema ICRS, que en la práctica
coincide con el BCRS, están definidos de manera que sean consistentes con el sis-
tema Eo
�o
, con una diferencia de alineación menor que 0.0002, lo que es despreciable
para la mayoŕıa de las aplicaciones.
En adelante llamaremos sistema espacial, S = {e
1
, e
2
, e
3
}, a un sistema de
referencia, que independientemente del origen, tiene unos ejes paralelos al ICRS.
En particular tendremos:
Sistema espacial geocéntrico6, S
G
, también llamado GCRS y que es el
sistema espacial con centro en el centro de masas de la Tierra.
Sistema espacial planetocéntrico, S
P
, o sistema espacial con centro en el
centro de masas de un planeta P .
El sistema S
G
(S
P
) será el sistema que usaremos a partir de ahora para cual-
quier observación realizada desde la Tierra (planeta) y sobre todo, por ser éste un
sistema inercial, para el planteamiento de las ecuaciones del movimiento de los
satélites artificiales.
El sistema S
G
es el sustituto actual de Eo
�o
, aunque como hemos dicho antes la
diferencia entre ellos es muy pequeña. La transformación de uno a otro será estu-
diada más adelante. Por otro lado, aunque el plano fundamental del sistema S
G
es
muy próximo al ecuador del instante J2000.0 no coincide exactamente con él por
lo que las coordenadas obtenidas en este sistema no son exactamente ecuatoriales.
Sin embargo, se ha mantenido el nombre de ascensión recta y declinación para las
coordenadas en este sistema, especificando, cuando haya posibilidad de confusión,
en cuál de los dos sistemas han sido medidas.
Para obtener las coordenadas de un punto en el sistema S
G
debemos partir del
sistema geográfico G, definido en el caṕıtulo anterior, pues es en éste donde el IERS
determina la posición del polo y, por tanto, del ecuador verdadero que es el que
va asociado a la observación, por ello, para entender el proceso que relaciona los
diferentes sistemas de referencia, debemos encontrar todo el conjunto de relaciones
y sistemas intermedios que ligan los sistemas G y S
G
.
En primer lugar llamaremos
5HCRF es el nombre de otra materialización de este sistema de menor precisión que ICRF y
obtenida con medidas realizadas desde el satélite Hipparcos.
6Este nombre no es utilizado fuera de este libro pero nos ha parecido coherente su introduc-
ción, dentro del contexto de esta obra, con objeto de simplificar y sistematizar la gran cantidad
de nombres que aparecen.
60 Sistemas de referencia espaciales precisos
Polo celeste intermedio, CIP, o simplemente P ,
al polo verdadero que el IERS sitúa en el sistema de referencia G. El nombre de
polo celeste intermedioviene a sustituir al de polo celeste de efemérides, CEP,
usado hasta 2003. Perpendicular al eje determinado por este punto se encuentra
el plano del ecuador intermedio con el que antes hab́ıamos definido el sistema E
�
usando como origen el equinoccio de la fecha.
Uno de los objetivos de la reforma de los sistemas de referencia de la IAU
es obtener una mayor precisión, lo que se consigue minimizando al máximo las
fuentes de error. El problema del movimiento del equinoccio proviene de dos
movimientos: el del ecuador y el de la ecĺıptica. Si prescindimos de la ecĺıptica, para
lo cual basta elegir un origen distinto al equinoccio, conseguiremos transformar
el problema en uno en el que solo intervenga la rotación de la Tierra y no los
problemas orbitales que perturban la ecĺıptica.
Para definir otros oŕıgenes en el ecuador verdadero se ha introducido el con-
cepto de origen no rotante que consiste en elegir un punto en el ecuador verdadero
móvil de manera que la posición instantánea de ese punto siempre se mantiene
perpendicular al ecuador, esto es, siempre se mueve en la dirección del polo P .
De otra forma el movimiento de este punto presentaŕıa una componente alrededor
del eje polar que introduciŕıa cierto movimiento espurio en el ángulo de rotación.
Aśı, han sido definidos dos nuevos puntos:
Origen celeste intermedio, CIO, representado por �, que sustituye al equi-
noccio como origen de coordenadas.
Origen terrestre intermedio, TIO, representado por $, que representa un
punto en el ecuador que rota con la Tierra. Este punto sustituye al antiguo
meridiano de Greenwich aunque está muy próximo al mismo.
Los sistemas de referencia asociados a estos oŕıgenes y que tienen el ecuador
intermedio como plano fundamental son llamados:
Sistema celeste intermedio, E
�
= {e�
1
, e�
2
, e�
3
}.
Sistema terrestre intermedio, E
$
= {e$
1
, e$
2
, e$
3
}.
4.3 Transformaciones entre sistemas de referen-
cia precisos
En este apartado desarrollaremos las transformaciones necesarias para rela-
cionar entre si todos los sistemas de referencia espaciales. Para esto seguiremos el
esquema de la tabla 4.1, donde cada número representa una transformación entre
dos sistemas contiguos, de manera que componiendo transformaciones podamos
finalmente relacionar G con S
G
. Cada número del esquema corresponde a una de
las siguientes transformaciones:
Transformaciones entre sistemas de referencia precisos 61
G
T1
x
?
?
?
y
E
$
T2b ��! E
�
T2c ��! E
�
0
m
T2a
x
?
?
?
y
x
?
?
?
y
T3
E
�
Em
�m
T6
x
?
?
?
y
x
?
?
?
y
T4
S
G
T5 ��! Eo
�o
Tabla 4.1: Transformaciones entre sistemas de referencia precisos.
T1. La corrección por el movimiento del polo.
T2. Tres cambios de origen en el ecuador intermedio que relacionan los sistemas
con origen en �, $, � y �0
m
.
T3. La corrección por nutación.
T4. La corrección por precesión.
T5. La desviación entre los sistemas Eo
�o
y S
G
.
T6. El tratamiento conjunto de la precesión-nutación sin usar el equinoccio.
Como puede verse en la tabla 4.1 existen dos caminos para relacionar G con
S
G
. El camino clásico, (T1,T2b,T3,T4,T5), usa la teoŕıa de la precesión y nutación
clásica basada en el equinoccio. Sin embargo, el moderno, (T1,T2a,T6), no usa el
equinoccio. En lo que sigue describiremos ambos caminos, con los parámetros del
camino clásico adaptados a los modelos desarrollados por la IAU en el año 2000.
En los siguientes subapartados se describe cada transformación por separado,
dando tanto los parámetros que la caracterizan como la matriz de transformación.
En algunos casos escribiremos la expresión precisa de los parámetros en términos
de una variable temporal T
s
7 que se explicará con detalle en el caṕıtulo siguiente
y que representa el número de siglos julianos transcurridos entre el instante del
cálculo y un instante estándar J2000.0. En otros casos no se escribe la expresión
debido a su enorme volumen. Tanto en estos casos como en los primeros, quien
tenga necesidad de su uso, puede acudir al conjunto de rutinas SOFA8 y NOVAS9,
ambas escritas en lenguaje C y FORTRAN y desarrolladas respectivamente por
7
T
s
= (JDTT � 2451545.0)/36525.
8http://www.iau-sofa.rl.ac.uk/
9http://aa.usno.navy.mil/software/novas/novas info.html
62 Sistemas de referencia espaciales precisos
la Unión Astronómica Internacional y el USNO (U.S. Naval Observatory). Estas
rutinas de software libre abarcan todas las transformaciones descritas en este
caṕıtulo.
4.3.1 Movimiento del polo (T1)
El movimiento del polo permite relacionar el sistema geográfico G con el sis-
tema E
$
cuyo polo, CIP, y ecuador, son los verdaderos de la fecha y su origen es
el origen terrestre intermedio, TIO (figura 4.4).
Llamaremos matriz de tambaleo a la matriz que pasa del sistema E
$
al sistema
geográfico G
RE$G = W = W (x
p
, y
p
, s0), (4.5)
donde (x
p
, y
p
, s0) son los tres parámetros que caracterizan el movimiento del polo.
Por un lado (x
p
, y
p
) representan la posición del polo instantáneo de rotación,
CIP, respecto al sistema G, mientras que s0 es el localizador del TIO, es decir,
representa el desplazamiento del origen de longitudes hasta el TIO, por lo que
determina la posición exacta del primer meridiano de E
$
. El valor de s0 viene
dado por s0 = 0.00000047T
s
, por lo que es despreciable para la mayor parte de las
aplicaciones.
El polo instantáneo, CIP, está muy próximo al polo internacional de referencia,
IRP, su distancia es menor que 0.002, por lo que su posición en la esfera se puede
aproximar por las coordenadas del punto en un sistema horizontal con centro en
el polo de referencia y cuyo eje Ox representa la posición del meridiano origen,
IRM, y el eje Oy la dirección Oeste (figura 4.4 izquierda). El IERS determina
y publica en sus boletines A y B, unas coordenadas (x, y) que constituyen una
buena aproximación a la posición del polo, expresadas en el sistema anterior, que
deben ser corregidas por unos elementos
(x
p
, y
p
) = (x, y) + (�x,�x)marea + (�x,�x)nutación,
que corresponden a la correcciones por marea oceánica y por nutación y que son
menores que 0.0001.
Observando la derecha de la figura 4.4, y tras efectuar tres rotaciones ele-
mentales, llegamos a la relación RGE$
= R
1
(y
p
)R
2
(x
p
)R
3
(�s0), cuya inversa es
W = RE$G = RT
3
(�s0)RT
2
(x
p
)RT
1
(y
p
), o teniendo en cuenta las relaciones entre
las matrices de rotación elemental en sus dos convenios, tendremos finalmente
W = eR
3
(�s0) eR
2
(x
p
) eR
1
(y
p
), (4.6)
que es la expresión que habitualmente aparece en la literatura.
Si efectuamos el producto de matrices anteriores, tenemos en cuenta que para
un valor muy pequeño de un ángulo a, expresado en radianes, se puede poner
Transformaciones entre sistemas de referencia precisos 63
IRP
IRM
CIP
Meridiano origen
Oeste y
p
x
p
y
p
x
p
e
$
3
s0
e
$
1
IRP
g
3
IRM
g
1
Figura 4.4: Movimiento del polo.
cos a ⇡ 1, sen a ⇡ a, y despreciamos los productos de dos pequeños arcos, se
obtendrá una expresión más simple deW , suficientemente aproximada en la mayor
parte de las aplicaciones:
W ⇡
0
@
1 �s0 �x
p
s0 1 y
p
x
p
�y
p
1
1
A .
La longitud y latitud de un punto de la superficie terrestre, en el sistema
geográfico G, son dos valores constantes (�
0
,�
0
) que junto con la altitud determi-
nan la posición del punto. Sin embargo, la longitud y latitud de un punto de la
superficie no son constantes cuando se considera el ecuador verdadero y el origen
$. Las coordenadas de un punto en este sistema E
$
serán dos variables que re-
presentaremos por (�,�). Este valor es muy importante pues son las coordenadas
que deben usarse para la observación astronómica y las que definen con precisión
las escalas de tiempo basadas en la rotación terrestre.
El valor de (�,�), se obtendrá a partir de las coordenadas del observador
(�
0
,�
0
) y del movimiento del polo W por mediode la expresión
cart(1,�,�) = W cart(1,�
0
,�
0
). (4.7)
Aunque la expresión anterior es exacta, el valor, extremadamente pequeño, de
x
p
, y
p
y s0 permite obtener una aproximación que da directamente la longitud y
latitud en la forma
� = �
o
+ tan�
o
(x
p
sen�
o
+ y
p
cos�
o
) ,
� = �
o
+ (x
p
cos�
o
� y
p
sen�
o
) ,
(4.8)
64 Sistemas de referencia espaciales precisos
expresión válida tomando x
p
, y
p
en radianes.
4.3.2 Cambios de origen en el ecuador intermedio (T2)
En el ecuador intermedio existen cuatro puntos que son oŕıgenes de cuatro
sistemas de referencia distintos: el origen intermedio terrestre, TIO o $, el origen
intermedio celeste, CIO o � y finalmente el equinoccio verdadero, � y el equinoccio
medio �0
m
. Para transformar entre si los sistemas de referencia que tienen como
plano fundamental el ecuador y estos puntos como oŕıgenes basta efectuar un giro
de eje Oz con el ángulo adecuado.
✓
GMSTGAST
$
�
�
�0
m
Figura 4.5: Cambios de origen en el ecuador
intermedio.
El ángulo entre el punto $ y el
equinoccio � no es sino el ángulo
horario del equinoccio medido des-
de el meridiano principal. Es por
tanto el tiempo sidéreo del meri-
diano que pasa por $. Este meri-
diano no es el mismo que el me-
ridiano de Greenwich, sin embar-
go, se ha mantenido a este ángu-
lo el nombre de tiempo sidéreo en
Greenwich. Por otra parte, pues-
to que está asociado al equinoccio
verdadero10 se le da el nombre de
tiempo sidéreo aparente en Green-
wich y se representará por las letras
GAST . El ángulo entre este pun-
to y el equinoccio medio �0
m
repre-
sentará el tiempo sidéreo medio en
Greenwich, GMST .
El ángulo entre $ y � se define de manera que estos dos puntos sean oŕıgenes
no rotantes, se le llama ángulo de rotación terrestre, y se denota por las siglas
ERA o por el śımbolo ✓.
Una vez definidos estos dos ángulos podemos determinar las matrices de rota-
ción que representan el cambio de origen en la forma:
RE$E�
= R
3
(�✓) = eR
3
(✓), RE$E�
= R
3
(�GAST ) = eR
3
(GAST ), (4.9)
mientras que la relación ente los sistemas E
�
y E
�
0
m
viene dada por
RE�E
�0
m
= R
3
(�EE), �EE = GAST �GMST . (4.10)
Al ángulo �EE se le llama ecuación de los equinoccios y su valor viene dado por
la expresión
�EE = � + 0.0000264096 sen⌦+ 0.0000006352 sen 2⌦+ . . . , (4.11)
10Esto se estudiará con detalle en el siguiente caṕıtulo.
Transformaciones entre sistemas de referencia precisos 65
que depende del valor � de la nutación en longitud, dado en (4.18), y de algu-
nos términos lunisolares como ⌦ y otros. En la anterior expresión hemos escrito
únicamente los tres términos más importantes.
4.3.3 Precesión (T4)
�
o
e
o
3
�
m
e
m
3
✏
o
A
!
A
�
A
�⇤
ecuador medio
en J2000.0
ecuador medio
ecĺıptica
en
J2000.0
ecĺıptica
Figura 4.6: Precesión: transformación con cuatro
rotaciones.
La precesión es la transfor-
mación entre el ecuador y equi-
noccio medios del año J2000.0,
que definen el sistema Eo
�o
, y el
ecuador y equinoccio medios de
una fecha, que definen el sistema
Em
�m
. Esta transformación se pue-
de modelar por medio de dos con-
juntos de parámetros diferentes.
La primera aproximación se
describe con cuatro parámetros
que relacionan la posición del
ecuador medio de las dos épocas
con el plano de la ecĺıptica en
J2000.0 y en la fecha. Los cuatro
parámetros (✏
o
,
A
,!
A
,�
A
), que
pueden verse en la figura 4.6, re-
presentan lo siguiente:
✏
o
es el valor de la oblicuidad media de la época J2000.0, es decir, el ángulo
entre el ecuador medio y la ecĺıptica en J2000.0, que tiene un valor constante.
A
es el ángulo entre el equinoccio medio de J2000.0, �
o
, y un punto �⇤ que
representa la intersección del plano de la ecĺıptica en J2000.0 con el ecuador
medio de la fecha.
!
A
es el ángulo entre el plano de la ecĺıptica en J2000.0 y el ecuador medio
de la fecha.
�
A
es el ángulo entre el punto �⇤ y el equinoccio medio �
m
.
Se llama matriz de precesión y se representa por la letra P a la matriz de paso
del sistema medio E�m
m
a la del sistema ecuatorial en J2000.0, Eo
�o
, esto es, a la
matriz REm
�m
Eo
�o
.
Para obtener la expresión de P en términos de los cuatro parámetros an-
teriores, observaremos la figura 4.6, donde podemos concluir que REo
�o
Em
�m
=
R
1
(✏
o
)R
3
(�
A
)R
1
(�!
A
)R
3
(�
A
). Teniendo en cuenta que P es la transpuesta de
la anterior tendremos que P = RT
3
(�
A
)RT
1
(�!
A
)RT
3
(�
A
)RT
1
(✏
o
) y aplicando la
relación entre las matrices de rotación con ambos convenios se llaga a la expresión
66 Sistemas de referencia espaciales precisos
P = eR
3
(�
A
) eR
1
(�!
A
) eR
3
(�
A
) eR
1
(✏
o
), (4.12)
que es una de las dos expresiones habituales de la matriz de precesión.
La expresión de los cuatro ángulos en función del tiempo, dado por la variable
T
s
, es la siguiente:
✏
o
= 23h26m21.s406 = 84381.00406,
A
= 5038.00481507T
s
� 1.000790069T 2
s
�0.0000114045T 3
s
+ 0.00000132851T 4
s
� 0.000000000951T 5
s
,
!
A
= ✏
0
� 0.00025754T
s
+ 0.000512623T 2
s
�0.0000772503T 3
s
� 0.00000000467T 4
s
+ 0.000000003337T 5
s
,
�
A
= 10.00556403T
s
� 2.003814292T 2
s
�0.0000121197T 3
s
+ 0.00000170663T 4
s
� 0.000000000560T 5
s
.
(4.13)
Aunque la IAU recomienda usar estos cuatro parámetros para calcular la ma-
triz de precesión, existe otro conjunto de tres parámetros, (z
A
, ✓
A
, ⇣
A
), idénticos
a los clásicos de la teoŕıa de la precesión previa al año 2000, pero que han sido
modificados para adaptarlos a la mayor precisión de las nueva teoŕıas.
�
o
e
o
3
�
m
e
m
3
⇣
A
✓
A
z
A
ecuador medio
en J2000.0
ecuador medio
Figura 4.7: Precesión: transformación con tres
rotaciones
En lugar de trabajar sobre el
ecuador los antiguos parámetros
describen la posición del polo del
sistema Em
�m
respecto del sistema
Eo
�o
como se ve en la figura 4.7. En
esta figura se observa como el ángu-
lo ✓
A
representa el ángulo entre los
vectores eo
3
y el vector em
3
, mientras
que z
A
es el ángulo entre el meri-
diano principal y el ćırculo máximo
que une los dos polos en el sistema
de referencia medio y ⇣
A
el mismo
ángulo en el sistema de referencia
medio de J2000.0.
En estas condiciones la ma-
triz P de paso de Em
�m
a Eo
�o
se obtendrá como composición de
tres rotaciones: P = REmE�o
=
R
3
(z
A
)R
2
(�✓
A
)R
3
(⇣
A
) y finalmen-
te pondremos la expresión habitual
P = eR
3
(�z
A
) eR
1
(✓
A
) eR
3
(�⇣
A
). (4.14)
Transformaciones entre sistemas de referencia precisos 67
Las expresiones de los tres ángulos, en función del tiempo dado por la variable
T
s
, son las siguientes:
⇣
A
= 2.00650545 + 2306.00083227T
s
+ 0.002988499T 2
s
+
0.0001801828T 3
s
� 0.00000005971T 4
s
� 0.000000003173T 5
s
,
z
A
= �2.00650545 + 2306.00077181T
s
+ 1.000927348T 2
s
+ 0.0001826837T 3
s
�0.00000028596T 4
s
� 0.000000002904T 5
s
,
✓
A
= 2004.00191903T
s
� 0.004294934T 2
s
� 0.0004182264T 3
s
�0.00000007089T 4
s
� 0.000000001274T 5
s
,
(4.15)
mientras que el valor del ángulo ✏, que representa la oblicuidad media o ángulo
entre el ecuador medio y la ecĺıptica, es igual a
✏ = ✏
o
� 46.00836769T
s
� 0.000001831T 2
s
+ 0.0000200340T 3
s
� 0.00000000576T 4
s
� 0.000000000434T 5
s
.
(4.16)
4.3.4 Nutación (T3)
✏
✏0 = ✏+�✏
�
e
�
1
e
�
3
e
m
1
e
m
3
ecuador
de la fecha
ecuador
medio
ecĺıptica
Figura 4.8: Nutación.
La nutación produce un pe-
queño desplazamiento del ecua-
dor, a lo largo de la ecĺıptica, des-
de el ecuador y equinoccio me-
dios hasta el ecuador y equinoc-
cio verdaderos. Se mide a partir
de dos ángulos: la nutación en
longitud, � , que mide el ángu-
lo entre el equinoccio medio y el
verdaderos en la ecĺıptica, y la
nutación en oblicuidad, �✏, que
mide la diferencia entre la obli-
cuidad media, ✏, o ángulo entre la
ecĺıptica y el ecuadormedio y la
oblicuidad verdadera, ✏0, o ángu-
lo entre la ecĺıptica y el ecuador
verdadero.
Se llama matriz de nutación a la matriz de rotación que pasa del sistema E
�
al
sistema Em
�m
que, de acuerdo con la figura 4.8, se podrá poner como N = RE�Em
�m
=
R
1
(✏0)R
3
(� )R
1
(�✏), de donde finalmente llegaremos a la expresión
N = eR
1
(�✏��✏) eR
3
(�� ) eR
1
(✏). (4.17)
68 Sistemas de referencia espaciales precisos
Los valores de �✏ y � se obtienen a partir de las dos series:
� =
N
X
i=1
(S
i
+ S0
i
T
S
) sen�
j
+ C 00
i
cos�
j
,
�✏ =
N
X
i=1
(C
i
+ C 0
i
T
S
) cos�
j
+ S00
i
sen�
j
,
(4.18)
siendo
�
i
=
K
X
j=1
�
j
(T
s
),
donde, para el modelo de nutación MHB, que es aceptado en el modelo IAU2000, se
tieneN = 1365 términos de la series, yK = 14 parámetros angulares dependientes
de las órbitas del Sol y la Luna. Este modelo ha sustituido al antiguo modelo de
Wahr en el que las series de la nutación teńıan 136 términos.
4.3.5 Tratamiento actual de la precesión y nutación (T6)
e
1
e
2
e
3
e
�
1
e
�
2
e
�
3
E
d
E
s
Figura 4.9: Transformación conjunta precesión–
nutación.
El tratamiento moderno de la
precesión y nutación se basa en
la posición del sistema E
�
res-
pecto del sistema S
G
a través de
tres parámetros (X,Y, s), que, de
forma similar al movimiento del
polo, representan la posición del
CIP en S
G
y la corrección s del
origen del sistema o localizador
del CIO.
Los valores de (X,Y ) repre-
sentan dos de los tres cosenos di-
rectores del vector e
�
3
, respecto
de la base {e
1
, e
2
, e
3
} del siste-
ma S
G
, de forma que
e
�
3
= Xe
1
+ Y e
2
+ Ze
3
,
Si llamamos (E, d) a la longitud
y la colatitud del vector e�
3
en el
sistema S
G
se tendrán las relaciones:
X = sen d cosE, Y = sen d senE, Z = cos d, (4.19)
donde el valor de Z es muy próximo a la unidad.
Transformaciones entre sistemas de referencia precisos 69
En la figura 4.9 se puede observar la posición del sistema E
�
, cuya base es
{e�
1
, e�
2
, e�
3
}, respecto del sistema S
G
, cuya base es {e
1
, e
2
, e
3
}. Llamaremos ma-
triz de precesión–nutación a la matriz C = RE�S
G
que pasa de E
�
a S
G
.
Observando la figura 4.9 podemos concluir que la matriz de rotación entre
los dos sistemas es RS
G
E�
= R
3
(E)R
2
(d)R
3
(�E)R
3
(�s), de donde se deduce
finalmente que C = RE�S
G
= R
3
(�s)TR
3
(�E)TR
2
(d)TR
3
(E)T y por tanto
C = eR
3
(�s) eR
3
(�E) eR
2
(d) eR
3
(E). (4.20)
Hemos calculado la matriz de rotación en términos de (E, d), sin embargo, se
ha dicho antes que esta transformación se plantea en términos de (X,Y ). Para
expresar C en términos de X,Y hay que efectuar el producto de las tres ma-
trices eR
3
(�E) eR
2
(d) eR
3
(E), aplicar las relaciones (4.19), y realizar una serie de
manipulaciones trigonométricas y simplificaciones para obtener
C = eR
3
(�s)
0
@
1� bX2 �bXY �X
�bXY 1� bY 2 �Y
X Y 1� b(X2 + Y 2)
1
A , (4.21)
donde, teniendo en cuenta que el valor de Z es pequeño, el valor de b = 1/(1+Z)
se puede aproximar, hasta una precisión del orden de 0.00000001 por la expresión
b = 1/2 + (X2 + Y 2)/8, de forma que Z no aparece en la matriz.
La teoŕıa IAU2000 para la precesión y nutación establece unos valores:
X = �0.0001661699 + 2004.0019174288T
s
� 0.0042721905T 2
s
�0.0019862054T 3
s
� 0.0000004605T 4
s
+ 0.0000000598T 5
s
+
P
i
[(a
s,0
)
i
sen(�j) + (a
c,0
)
i
cos(�j)]
+
P
i
[(a
s,1
)
i
t sen(�j) + (a
c,1
)
i
t cos(�j)]
+
P
i
[(a
s,2
)
i
t2 sen(�j) + (a
c,2
)
i
t2 cos(�j)]
+ · · · ,
Y = �0.0000695078� 0.0002538199T
s
� 22.0040725099T 2
s
+0.0000184228T 3
s
+ 0.0000111306T 4
s
+ 0.0000000099T 5
s
+
P
i
[(b
c,0
)
i
cos(�j) + (b
s,0
)
i
sen(�j)]
+
P
i
[(b
c,1
)
i
t cos(�j) + (b
s,1
)
i
t sen(�j)]
+
P
i
[(b
c,2
)
i
t2 cos(�j) + (b
s,2
)
i
t2 sen(�j)]
+ · · · ,
con los términos �
j
dependientes de la nutación. La expresión de s es similar a la
de X e Y .
70 Sistemas de referencia espaciales precisos
4.3.6 Desviación (T5) entre los sistemas Eo
�
o
y S
G
Finalmente veremos como pasar del nuevo sistema fundamental S
G
al anti-
guamente usado Eo
�o
y viceversa. Para ello tendremos en cuenta que la posición de
los dos polos y la dirección de los oŕıgenes respectivos está muy próxima, además
la posición de los unos respecto a los otros es fija.
Los parámetros que describen esta pequeña desviación son las coordenadas
(⇠
o
, ⌘
o
) del polo de E
�o
en el sistema S
G
. Como puede verse en la figura 4.10 estas
coordenadas están dadas en un sistema de dos dimensiones, tangente al polo de
S
G
, y cuyas direcciones O⇠, O⌘ representan el meridiano origen y el de un valor
⇡/2. En este sistema el polo de Eo
�o
ocupa la posición ⇠
o
= �0.00016617, ⌘
o
=
�0.000068192. El desplazamiento del origen se mide por el valor d↵
0
= �0.000146.
Polo S
G
Polo E
�o
(⇠
o
, ⌘
o
)
⇠
⌘
|⇠
o
|
|⌘
o
|
e
1
e
2
e
3
e
o
1
e
o
2
e
o
3
|d↵
o
|
|⌘
o
|
|⇠
o
|
Figura 4.10: Desviación del sistema E
�o .
La llamada matriz del sesgo de la referencia y denotada por la letra B deter-
mina la transformación del sistema E
�o
al sistema S
G
, es decir B = RE�oS
G
.
De acuerdo con la figura 4.10, la matriz RS
G
E�o
se obtendrá componiendo tres
rotaciones R
3
(�|d↵
o
|)R
2
(�|⇠
o
|)R
1
(|⌘
o
|), que de acuerdo con los signos de d↵
o
, |⇠
o
|
y |⌘
o
| se pondrá RS
G
E�o
= R
3
(d↵
o
)R
2
(⇠
o
)R
1
(�⌘
o
). Finalmente, podremos poner
RE�oS
G
= R
1
(�⌘
o
)TR
2
(⇠
o
)TR
3
(d↵
o
)T , o lo que es igual
B = eR
1
(�⌘
o
) eR
2
(⇠
o
) eR
3
(d↵
o
). (4.22)
Si efectuamos el producto de matrices anterior y después aproximamos las
funciones trigonométricas por el arco o por la unidad, como ya se ha hecho en
un cálculo anterior, se obtendrá una expresión más simple de B, suficientemente
Relación de los sistemas precisos con los sistemas idealizados 71
aproximada en la mayor parte de las aplicaciones:
B ⇡
0
@
1 d↵
o
�⇠
o
�d↵
o
1 �⌘
o
⇠
o
⌘
o
1
1
A .
4.3.7 Transformación general de coordenadas
Finalmente, reuniendo todas las transformaciones dadas hasta aqúı, podemos
obtener la expresión de la transformación general de coordenadas entre el sistema
geográfico y el sistema GCRS o el del equinoccio y ecuador medios del J2000.0.
Las transformaciones pueden resumirse en las siguientes expresiones:
xS
G
= CT
eR
3
(�✓)W xG ,
xS
G
= BTPTNT
eR
3
(�GAST )W xG ,
xEo
�o
= BCT
eR
3
(�✓)W xG ,
xEo
�o
= PTNT
eR
3
(�GAST )W xG ,
(4.23)
y sus transpuestas:
xG = WT
eR
3
(✓)C xS
G
,
xG = WT
eR
3
(GAST )N P B xS
G
,
xG = WT
eR
3
(✓)C BT
xEo
�o
,
xG = WT
eR
3
(GAST )N P xEo
�o
.
(4.24)
4.4 Relación de los sistemas precisos con los sis-
temas idealizados
En el caṕıtulo anterior se han definido una serie de sistemas idealizados ba-
sados en la consideración de planos fijos del ecuador y la ecĺıptica. Si tenemos
en cuenta el movimiento de éstos deberemos establecer una serie de premisas que
condicionarán las relaciones entre todos los sistemas.
En primer lugar deberemos considerar que el sistema horizontal se establece a
partir de la dirección del zenit y del sur como origen del acimut. La dirección sur
se puede definir a partir del meridiano del lugar, por observación de la culminación
superior de los astros, o bien a partir de la dirección sur prefijada geográficamente.
El primer caso define unas coordenadas horizontales relacionadas con unas coor-
denadas horarias definidas sobre el ecuador verdadero, mientras que en el segundo
caso el ecuador es el ecuador fijo de la Tierra o lo que es igual el plano Oxy del
sistema geográfico. Los dos sistemas horizontales basados en estas dos diferentes
elecciones son distintos y su relación con el sistema ecuatorial viene dada, en el
72 Sistemas de referencia espaciales precisos
primer caso, a través de la latitud � del lugar, corregidadel movimiento del po-
lo, mientras que en el segundo se relacionan a partir de la latitud �
o
del lugar
sin corregir por el movimiento del polo. De cualquier manera, el movimiento del
polo es muy pequeño y no conocido a priori por lo que en la mayor parte de las
aplicaciones se pueden hacer coincidir ambos sistemas.
El sistema horario y el ecuatorial se entenderán referidos al ecuador verdadero.
Entenderemos por ecĺıptica la de la fecha. El paso al sistema de referencia
ecĺıptico se puede hacer, bien desde el sistema ecuatorial verdadero de la fecha,
cuya intersección con la ecĺıptica es el equinoccio verdadero �, y su ángulo con
ella es la oblicuidad verdadera ✏0, o bien desde el ecuador medio de la fecha, cuya
intersección con la ecĺıptica es el equinoccio medio �
m
y su ángulo con ésta es la
oblicuidad media ✏.
Finalmente, hay que decir que los elementos de la rotación de un planeta,
coordenadas del polo y posición del meridiano origen, son medidos en el sistema
espacial con centro en el centro de masas del planeta S
P
por lo que la matriz
RE�P$
, dada en (3.23), representa realmente la matriz RSP P$
, esto es, el paso
del sistema celeste de referencia al planetográfico.
Caṕıtulo 5
Referencia temporal
5.1 Introducción
La naturaleza del tiempo es una complicada cuestión a la que ni la Filosof́ıa
ni la F́ısica han dado una respuesta definitiva. Nos limitaremos a tratar el tiem-
po como una variable independiente que sirve como referencia para describir la
evolución de los fenómenos f́ısicos o dinámicos.
Mediante la medida del tiempo se persiguen dos finalidades distintas: por un
lado, se trata de fijar el instante en que sucede un determinado acontecimiento,
problema cronológico, y por otro, medir el intervalo de tiempo transcurrido entre
dos acontecimientos, problema cronométrico. Para la primera cuestión es necesa-
rio fijar una época origen y, a partir de ella, contar el número de ciclos (o fracción)
de un fenómeno periódico que han transcurrido desde entonces, por ejemplo, el
número de veces que el Sol ha pasado por el meridiano del lugar. Con respecto al
aspecto cronométrico, el tiempo puede estar o no asociado a una época determi-
nada. Por ejemplo, a un ciclista que corre una etapa, solamente le interesa saber
el número de minutos, segundos y fracciones de segundo que han transcurrido
desde que partió de la salida hasta que cruza la ĺınea de meta. La fecha le interesa
solamente para saber donde debe estar cierto d́ıa a cierta hora. Con respecto al
intervalo de tiempo, es esencial la sincronización. En efecto, siguiendo con el śımil
anterior, el ciclista debe tener su reloj sincronizado con el reloj de la organización,
pues de lo contrario, podŕıa llegar tarde a la salida. El problema de la sincroniza-
ción se hace más acuciante en determinados problemas como la navegación aérea,
las telecomunicaciones, electrónica, etc..
Determinadas actividades requieren relojes o instrumentos de medida sencillos,
74 Referencia temporal
mientras que otras los necesitan mucho más precisos. Aśı, los pueblos primitivos
se reǵıan por el movimiento del Sol, puesto que les condicionaba sus actividades
diarias, horas de descanso, de vigilia y comidas. Algunas ciencias, como la Geo-
loǵıa y la Astronomı́a, manejan intervalos de tiempo del orden de miles y millones
de años, por lo que un par de años le es indiferente; por el contrario, la Electrónica
necesita saber medir fracciones muy pequeñas de segundo, por ejemplo, si un or-
denador va a 132 MHz, quiere decir que necesitan contar 132,000,000 oscilaciones
en un segundo, para lo que necesitan un reloj con una precisión mucho mayor.
Como vemos, dependiendo del usuario, se necesitan distintos grados de precisión,
lo que hace que se manejen distintas escalas de tiempo.
Desde los albores de la humanidad, el movimiento de los astros ha marcado
las primeras escalas de tiempo, por lo que todav́ıa se siguen utilizando. El año, el
mes y el d́ıa han sido las unidades naturales obtenidas a partir de tres diferentes
ciclos astronómicos. Grosso modo, éstos se pueden definir como:
Año, el periodo de una revolución completa de la Tierra alrededor del Sol.
Mes, el intervalo transcurrido entre dos Lunas llenas sucesivas.
Dı́a, el tiempo entre dos pasos consecutivos del Sol por su punto más alto
sobre el horizonte.
Las tres unidades anteriores determinan el marco habitual donde circunscribi-
mos el concepto tiempo, sin embargo, su definición conlleva una serie de dificul-
tades que hacen necesario un estudio profundo de las mismas para alcanzar los
requerimientos actuales en la medida del tiempo.
Por un lado el año no contiene un número exacto de d́ıas, ni un número exacto
de meses y el mes tampoco contiene un número exacto de d́ıas. Por otra parte, a
lo largo del año, la duración del d́ıa, definido como el intervalo de tiempo entre
dos pasos consecutivos del Sol por el meridiano del lugar, no es la misma, pues
la Tierra se mueve sobre una elipse, viajando en ocasiones más rápida y en otras
más lenta. Si en lugar de basar la duración del d́ıa sobre el movimiento del Sol, se
basa sobre el movimiento de las estrellas, resultará que este d́ıa de las estrellas,
d́ıa sidéreo, es unos 4 minutos más corto que el d́ıa solar. Sin embargo, como las
estrellas están muy alejadas, este tiempo no vaŕıa con la época del año en la que
nos encontremos.
Además, tal como se empezó a sospechar en el siglo XVII, la Tierra no gira
uniformemente alrededor de su eje, sino que tiene fluctuaciones y, además, se va
frenando gradualmente. Por otra parte, los polos terrestres, que determinan el
eje de giro de la Tierra, sobre el que hemos definido el d́ıa, también se mueven
unos pocos metros en un año, lo que produce discrepancias del orden de unos 30
milisegundos de un año al siguiente. Se hace necesario, por tanto, un reloj que mida
periodos constantes uniformemente. Esto se ha conseguido mediante la frecuencia
de radiación emitida por un átomo de cesio. Pero como todas las unidades de
tiempo habituales (hora, d́ıa, mes, año, etc.) tienen un origen astronómico, ha
Relojes basados en la rotación terrestre 75
sido preciso definir distintas escalas de tiempo, que veremos más adelante, con
objeto de unificar las medidas de relojes astronómicos y atómicos.
5.2 Relojes basados en la rotación terrestre
Desde un punto de vista práctico, podemos definir un d́ıa como el intervalo de
tiempo transcurrido entre dos pasos consecutivos de una cierta referencia espacial,
situada en la esfera celeste, por un meridiano terrestre. De esta manera, podemos
construir nuestro reloj tomando las 0h como la posición del punto del ecuador
que se encuentra en el mismo meridiano que el punto de referencia y dividir el
ecuador en 24 sectores. El ángulo entre la dirección del meridiano y la del punto
de referencia, ángulo horario, medido en horas, nos determina la hora de nuestro
reloj (Figura 5.1).
Punto de referencia
Tierra
Meridiano
0h
6h
12h
18h
Figura 5.1: Reloj natural basado en la ro-
tación terrestre.
A pesar de la aparente sencillez
de este reloj, aparecen ya los prime-
ros problemas en la determinación de
la hora. En primer lugar la falta de
uniformidad de la rotación terrestre de
la que prescindiremos por el momento.
Por otro lado, cada meridiano señala
una dirección diferente, por lo que la
hora del reloj depende del meridiano
elegido, lo que significa que la hora da-
da por este reloj es local, esto es, de-
pende del lugar en que la midamos.
Por último, debemos elegir el punto
de referencia. La mejor referencia posi-
ble seŕıa un punto fijo en el ecuador;
sin embargo, esto no será posible des-
de un punto de vista práctico. Por ello,
el movimiento del punto de referencia
deberá ser tenido en cuenta para corre-
gir la hora dada por el reloj.
5.2.1 Tiempo sidéreo
Las estrellas no sirven como punto de referencia, pues su movimiento propio,
aunque pequeño, es en muchoscasos muy mal conocido; es por lo que se utiliza
como referencia el equinoccio �, cuyo movimiento por precesión y nutación es
lento y está muy bien estudiado. Llamaremos tiempo sidéreo al tiempo asociado
a un reloj basado en la rotación terrestre y que toma como referencia el punto �.
Es decir, el tiempo sidéreo, ST , será el ángulo horario del punto �.
76 Referencia temporal
Al estudiar la precesión y nutación vimos que pueden definirse tres equinoccios
diferentes. El equinoccio �
0
de la época J2000.0, el equinoccio verdadero de la fecha
�, que es el anterior corregido por precesión y nutación y el equinoccio medio �
m
,
que es el de la época J2000.0 corregido solo por precesión. Aunque el equinoccio
�
0
representa una posición fija en el espacio— por lo que constituiŕıa la referencia
perfecta— no se utiliza, pues no va ligado a la observación astronómica como
sucede con los otros dos.
La complejidad del modelo de la nutación y su pequeño valor hacen que en
general sea suficiente tomar como referencia el equinoccio medio, lo que nos lleva
a definir el tiempo sidéreo medio. Este es el que se usa habitualmente, salvo para
casos de gran precisión. Si se toma el equinoccio de la época hablaremos de tiempo
sidéreo aparente.
Llamaremos tiempo sidéreo local aparente, LAST , al ángulo horario del equi-
noccio de la fecha. El ángulo horario del equinoccio medio será llamado tiempo
sidéreo local medio, LMST . Este ángulo es el que coincide con el tiempo sidéreo
ST , y está asociado a la observación astronómica.
La diferencia entre los dos tipos de tiempo sidéreo local será igual a la diferencia
de la ascensión recta del equinoccio medio y el de la época que, de acuerdo con
la teoŕıa de la nutación, podrá ponerse como
LAST � LMST = �EE,
donde �EE es la ecuación de los equinoccios, definida en (4.11).
�
o
�
m
�
G
(TIO, $)
L
(meridiano local)
L ST
G ST
�
Figura 5.2: Tiempos sidéreos.
El hecho de ser local obliga a
usar un reloj distinto en cada lu-
gar. Para corregir esto, utilizaremos
de manera global el reloj de tiem-
po sidéreo de un lugar determinado.
Tradicionalmente para ello se utili-
zaba el observatorio de Greenwich
definiendo el tiempo sidéreo medio
en Greenwich, GMST , y el tiem-
po sidéreo aparente en Greenwich,
GAST , cuya relación vendrá da-
da también a través de la ecuación
de los equinoccios. Las resoluciones
de la IAU del año 2000 han sus-
tituido el meridiano de Greenwich
por el origen terrestre intermedio
(TIO, $) como origen del sistema
geográfico por lo que no teńıa senti-
do mantener el meridiano de Green-
wich como lugar común para la medida de un tiempo sidéreo universal, sin embar-
go, la generalización del uso de los nombres anteriores ha obligado a mantenerlos
aunque modificando su definición para usar el nuevo origen.
Relojes basados en la rotación terrestre 77
La figura 5.2 permite encontrar la relación entre los tiempos sidéreos locales
y en Greenwich a través de la longitud, �, del lugar como
GMST = LMST � �, GAST = LAST � �. (5.1)
A partir de ahora, salvo que se diga lo contrario, despreciaremos la nutación y
hablaremos únicamente del tiempo sidéreo refiriéndonos al tiempo sidéreo medio
y llamaremos d́ıa sidéreo a un periodo de 24h de tiempo sidéreo medio.
5.2.2 Ángulo de rotación terrestre
El modelo de movimiento del polo y rotación de la Tierra establecido por la
Unión Astronómica Internacional en el año 2000, presentado en el caṕıtulo 4, es-
tablece dos puntos de referencia no rotantes en el ecuador verdadero o intermedio:
el origen intermedio terrestre (TIO, $) y el origen celeste intermedio (CIO, �),
que representan respectivamente el origen de un sistema rotante con la Tierra
y el de un sistema fijo. Estos puntos están próximos, aunque no son iguales, al
meridiano de Greenwich y al equinoccio. Al ángulo entre estos dos puntos se le
llama ángulo de rotación terrestre (ERA, ✓) y puede verse en la figura 4.5. Los
puntos que lo forman están definidos de manera que su variación con respecto al
tiempo coincida exactamente con la velocidad angular de rotación de la Tierra
d✓
dt
= !.
En realidad este ángulo no representa un tiempo, pero su variación lo relaciona
directamente con éste y su significado es equivalente al del GAST cuando se utiliza
el CIO en lugar del equinoccio.
5.2.3 Tiempo solar y tiempo medio
El equinoccio es, por su lento movimiento, la mejor referencia posible para la
definición del d́ıa. Sin embargo, el concepto de d́ıa ha venido siempre asociado a
la sucesión d́ıa–noche debida a la permanencia del Sol por encima del horizonte.
Esto nos lleva a considerar el Sol como referencia y por ello definir un nuevo
tiempo, el tiempo solar.
Se define el tiempo solar o tiempo solar verdadero como el ángulo horario del
Sol, H�. Esta definición presenta la ventaja de adaptarse mejor al concepto de
tiempo en la vida civil, pero tiene el inconveniente de que el punto de referencia
tiene movimiento mucho más rápido que el del equinoccio. En efecto, mientras el
equinoccio medio se mueve unos 0.s0084 por d́ıa, el Sol se mueve aproximadamente
1� por d́ıa.
78 Referencia temporal
Sol medio
Sol
L
(meridiano
local)
G
(TIO, $)
�ET
H
m
H�
24h � �
Figura 5.3: Tiempo solar y tiempo medio.
Por otro lado, se presenta un pro-
blema mucho más serio debido a que
el desplazamiento aparente del Sol en
torno a la Tierra no es uniforme, a cau-
sa de la excentricidad de la órbita. Por
ello, puesto que el valor de H� no vaŕıa
de modo uniforme, no puede ser usado
como reloj, y se hace necesaria la cons-
trucción de un reloj uniforme basado
en la hora solar.
En lugar del Sol, tomaremos como
referencia un punto imaginario, que lla-
maremos Sol medio (S
m
), que reco-
rre el ecuador con velocidad constante
igual al movimiento medio de la órbi-
ta aparente del Sol alrededor de la Tie-
rra1. Aunque dicho punto no es visible,
la posición del Sol medio sobre el ecua-
dor viene definida por su ascensión recta ↵
m
que es calculada por la Mecánica
Celeste.
Llamaremos tiempo medio o tiempo solar medio al ángulo horario H
m
del
Sol medio. Este es el tipo de tiempo que nos permitirá una mayor aproximación
al tiempo usado habitualmente por todos nosotros. Al intervalo de 24h horas de
tiempo medio le llamaremos d́ıa medio.
La relación del tiempo medio con el tiempo solar vendrá dado a través de la
ecuación del tiempo
�ET = H� �H
m
, (5.2)
que debe ser aplicada siempre que observemos la hora dada por un reloj de Sol,
tiempo solar y queramos transformarla en tiempo medio (figura 5.3).
La figura 5.4 nos muestra la evolución de la ecuación del tiempo, cuyo valor
es calculado por la Mecánica Celeste, a lo largo del año. Como puede observarse,
la ecuación del tiempo posee dos máximos, dos mı́nimos y cuatro ceros a lo largo
del año. Aproximadamente, los ceros se producen el 16 de abril, 13 de junio, 1 de
1Lógicamente, este punto no puede ser cualquiera, sino que debe definirse con precisión a
partir de razonamientos basados en las propiedades de la órbita kepleriana del Sol en torno a
la Tierra que se verán en la segunda parte de este libro. Para ello, imaginemos otro punto, que
llamaremos Sol ficticio S
f
, que se mueve sobre la ecĺıptica, órbita del Sol, con velocidad constante
n, y que coincide con el Sol en el perigeo ⇧ de la órbita del Sol. Aśı pues, sobre la ecĺıptica, el
arco c⇧S = f (anomaĺıa verdadera), mientras que d⇧S
f
= ` (anomaĺıa media). Pues bien, el Sol
medio definido anteriormente, es tal que se mueve sobre el ecuador, con la misma velocidad n
que S
f
y coincide con éste en el equinoccio �; por ello, y prescindiendo del pequeño efecto de la
precesión que no afecta por igual a las coordenadas ecuatoriales y ecĺıpticas, podemos admitir
que la ascensión recta ↵
m
del Sol medio coincide con la longitud ecĺıptica L de S
f
. Con esto, la
diferencia �� ↵
m
= �� L = f � `. La expresión f � ` es llamadaecuación del centro.
Relojes basados en la rotación terrestre 79
d́ıas35030025020015010050
15m
10m
5m
�5m
�10m
Figura 5.4: Ecuación del tiempo �ET. El eje horizontal representa los d́ıas transcurri-
dos desde el comienzo del año. El eje vertical representa los minutos de desfase entre el
tiempo solar y el tiempo medio.
septiembre y 25 de diciembre; el máximo absoluto el 3 de noviembre (unos 16m) y
el máximo relativo el 14 de mayo (unos 4m); el mı́nimo absoluto el 11 de febrero
(unos 4m) y el mı́nimo relativo el 26 de julio (unos 6m).
5.2.4 Tiempo universal
El tiempo utilizado en la vida civil está basado en el tiempo medio. Sin em-
bargo, dada su definición como el ángulo horario del Sol medio, se desprende un
aspecto que no concuerda con el uso civil. En efecto, para usos comunes, el d́ıa
comienza a media noche, cuando el Sol tiene un ángulo horario de 12h y no al
mediod́ıa, cuando el ángulo horario es 0h. Este desfase se corrige añadiendo 12h
al tiempo medio. Por ello, en 1925 se definió el tiempo civil local como
T
c
= H
m
+ 12h. (5.3)
De nuevo, este tiempo sigue teniendo un carácter local. Aśı, la hora civil de San-
tiago de Compostela diferiŕıa de la hora de Zaragoza en unos 30m debido a la
diferencia de longitud, por lo que el tiempo civil no es todav́ıa el candidato más
adecuado para la creación de un reloj que nos sea de utilidad y de uso sencillo y
común. Hasta finales del siglo XIX, cada páıs teńıa establecido su propio meri-
diano origen con objeto de proporcionar una hora común al páıs, y que sirviera de
referencia a los marinos para determinar la longitud a que se encontraban los bar-
cos en sus largas traveśıas maŕıtimas. Con objeto de tener un tiempo común para
todos los lugares, se toma de nuevo el origen terrestre intermedio (TIO, $) en
sustitución del meridiano del observatorio de Greenwich, y a la hora civil en este
meridiano se le llama Tiempo Universal Cero, UT0 . La relación de este tiempo
80 Referencia temporal
con el tiempo civil vendrá dada a partir de la longitud, �
0
, del lugar en la forma
UT0 = T
c
� �
o
. (5.4)
En la ecuación anterior (5.4), se relaciona el tiempo civil obtenido a partir de la
observación del ángulo horario del Sol medio con la longitud �
o
del observatorio,
sin corregir ésta por el efecto del movimiento del polo. Si empleamos la longitud
corregida, tendremos el llamado Tiempo Universal Uno, UT1 , cuya relación, de
acuerdo con la primera de las ecuaciones (4.8), será
UT1 = UT0 � tan�
o
(x
p
sen�
o
+ y
p
cos�
o
), (5.5)
donde UT1 representa la medida de la rotación real de la Tierra independiente-
mente de la localización del observador.
El ángulo de rotación de la Tierra ha sido definido de manera que tenga
una relación lineal con UT1 y está dado en términos de rotaciones de la Tierra
(unidades de 2⇡ radianes) desde el 2000 Enero 1 a las 12h de UT1 . Su valor es
igual a
✓ = 0.7790572732640 + 1.00273781191135448T
d
, (5.6)
donde T
d
2 representa el número de d́ıas, de tiempo UT1 , transcurridos desde el
instante origen. El valor de ✓, en radianes, se obtiene multiplicando la cantidad
anterior por 2⇡.
En ambientes no astronómicos se utiliza a veces el término Tiempo Medio de
Greenwich (GMT). Antes de 1926 dicho término se refeŕıa realmente al tiem-
po medio del meridiano de Greenwich, sin embargo, desde 1926 se utiliza para
referirse al tiempo civil de Greenwich, o lo que es igual al tiempo universal, sin
especificación del tipo (en su forma de uso más reciente se identifica con el Tiempo
Universal Coordinado UTC que veremos después). Esta ambigüedad de la defini-
ción y su distinta interpretación antes y después de 1926 han llevado a la Unión
Astronómica Internacional a desaconsejar su uso.
El tiempo UT1muestra irregularidades causadas por determinadas variacio-
nes de la rotación terrestre, que son de tipo secular (como el frenado que sufre
por rozamiento de las aguas con el fondo marino), periódicas (mareas lunares,
desplazamientos estacionales de grandes masas de agua en estado sólido, ĺıquido
o gaseoso), e irregulares (terremotos, volcanes, etc.). Las variaciones periódicas
permiten corregir el UT1 y definir el llamado Tiempo Universal Dos, UT2 , cuya
relación con UT1viene dada por
UT2 �UT1 = 0.s022 sen(2⇡t)� 0.s012 cos(2⇡t)
� 0.s006 sen(4⇡t) + 0.s007 sen(4⇡t),
donde t es la fracción de año trópico (que se verá en la siguiente sección) transcu-
rrido desde el momento en que la longitud del Sol medio es de 280�. Este tiempo
no será usado en la práctica, por lo que en adelante lo consideraremos igual a
UT1 .
2
T
d
= JDUT1 � 2451545.0.
Movimiento orbital de la Tierra: el año 81
5.3 Movimiento orbital de la Tierra: el año
El concepto de año viene asociado al movimiento orbital de la Tierra en torno
al Sol o, de forma equivalente, al del Sol en torno a la Tierra. Suele llamarse año
al periodo de dicha órbita, que de acuerdo con las leyes de Kepler seŕıa constante
si el Sol y la Tierra estuviesen aislados formando un problema de dos cuerpos.
Las perturbaciones ocasionadas por el resto de los planetas producen una
variación del periodo orbital, lo que nos lleva a la conclusión de que la duración
del año no es constante. Por otro lado, la definición del año como el tiempo
transcurrido entre dos pasos del Sol por un punto determinado de la ecĺıptica
requiere la elección de una referencia donde medir el paso del Sol. Si la órbita
fuese kepleriana, cualquier punto nos daŕıa el mismo valor del año; sin embargo,
como la órbita está perturbada, la elección del punto de referencia mediante el cual
medimos el periodo adquiere una importancia fundamental, pues su movimiento
se combina con la variación del periodo orbital, dando lugar a años con diferente
duración.
Podemos pensar en varias referencias para medir la duración del año. Por
un lado, el perigeo3 de la órbita. Este es el punto de referencia más adecuado
si pensamos en la integración del problema dinámico teniendo en cuenta que
las ecuaciones del movimiento vendrán expresadas en un ángulo medido desde
el perigeo, la anomaĺıa verdadera, que vaŕıa de 0 a 2⇡ entre un perigeo y otro.
Llamaremos año anomaĺıstico, A
a
, al intervalo de tiempo transcurrido entre dos
pasos consecutivos del Sol por el perigeo.
Llamaremos año sidéreo, A
s
, al intervalo de tiempo transcurrido entre dos
pasos consecutivos del Sol por el equinoccio �
o
de una época fija. Conocida por
integración la duración del año anomaĺıstico, la misma integración nos dará el
movimiento del perigeo lo que permitirá obtener el año sidéreo.
Los años sidéreo y anomaĺıstico vienen definidos a través de una referencia
ligada al movimiento orbital, sin embargo, no son éstos los más útiles desde el
punto de vista práctico. De hecho, una de las ventajas del uso del año como
medida del tiempo es su relación con las estaciones que se definen a partir del
paso del Sol por los equinoccios y solsticios. Por ello, es conveniente usar como
referencia el equinoccio medio de la época para que la medida del año venga
asociada intŕınsecamente al comienzo de la primavera astronómica en el hemisferio
norte. Se llama año trópico, A
t
, al intervalo de tiempo transcurrido entre dos pasos
consecutivos del Sol por el equinoccio medio.
Por observación, se puede calcular la duración, en d́ıas medios, del año trópi-
co, resultando ser aproximadamente de unos 365.2422. Que el año no tenga un
número exacto de d́ıas ha creado numerosos problemas a la hora de confeccionar
3Punto de mayor proximidad entre el Sol y la Tierra. El concepto de perigeo será definido
con precisión en el caṕıtulo 8.
82 Referencia temporal
calendarios y es el motivo de la introducción de los años bisiestos. Por ello se in-
troduce un nuevo tipo de año, llamado año juliano, que tiene exactamente 365.25
d́ıas medios.
La Mecánica Celeste establece la duración, expresada en d́ıas medios, del añoanomaĺıstico y el año sidéreo, que resulta ser
A
a
= 365.25964134 + 0.0000000304T
s
,
A
s
= 365.25636042 + 0.0000000011T
s
.
(5.7)
Para obtener la duración del año trópico bastará combinar la duración del año
sidéreo con el valor de la precesión en longitud para establecer el valor
A
t
= 365.24219897 + 0.0000000614T
s
. (5.8)
La duración de estos años se puede tomar, de manera bastante aproximada, como
A
a
= 365.2596, A
s
= 365.2564, A
t
= 365.2422,
d́ıas medios.
5.4 Relación entre el tiempo sidéreo y el tiempo
medio
Para encontrar la relación entre el tiempo sidéreo y el tiempo medio en cual-
quiera de sus versiones anteriores, hay que considerar el tiempo que tarda el Sol
medio en pasar dos veces consecutivas por el equinoccio medio, es decir, el año
trópico.
Sol
� �
Tierra
(1)
(2)
⇣
⇣
Figura 5.5: Relación entre la duración del
d́ıa medio y el d́ıa sidéreo.
Supongamos que un cierto d́ıa, el
equinoccio medio y el meridiano del lu-
gar están en la misma dirección, que
coincide con la del meridiano del lu-
gar (posición (1) de la figura 5.5). Al
cabo de un d́ıa sidéreo, el equinoccio
volverá a pasar por el meridiano del
lugar (posición (2) de la figura 5.5),
sin embargo el Sol medio todav́ıa no
habrá culminado, faltándole un ángu-
lo ⇣. El d́ıa sidéreo es, por tanto, más
corto que el el d́ıa medio.
Al cabo de un año trópico, el Sol
y el equinoccio volverán a estar alinea-
dos en el mismo meridiano pero mien-
tras el Sol ha pasado un cierto número
de veces por el meridiano del lugar, el
Relación entre el tiempo sidéreo y el tiempo medio 83
equinoccio habrá pasado exactamente un d́ıa más (puesto que la Tierra ha dado
exactamente una vuelta en el año trópico), lo que significa que si el año trópico
tiene una duración de A
t
d́ıas medios, su valor en d́ıas sidéreos será exactamente
A
t
+ 1, luego se verifica que (A
t
+ 1) d́ıas sidéreos = A
t
d́ıas medios. Esto nos
dará la relación entre el d́ıa medio y el d́ıa sidéreo que, para el valor A
t
= 365.2422
dado anteriormente, permite poner:
1 d.s. =
365.2422
366.2422
= 0.9972696 d.m. = 23h56m4.s09053 de tiempo medio,
1 d.m. =
366.2422
365.2422
= 1.0027379 d.s. = 24h3m56.s55537 de tiempo sidéreo,
que nos dan la relación entre el d́ıa sidéreo y el medio. Como podemos apreciar,
el d́ıa sidéreo es unos cuatro minutos más corto que el medio.
También podemos definir la función Int
sid
(), que transforma tiempo medio
en sidéreo, y la función Int
med
(), que transforma tiempo sidéreo en medio. Estas
funciones vendrán dadas por:
Int
sid
(x) = 1.0027379x, Int
med
(x) = 0.9972696x,
Int
sid
(x) =
A
t
+ 1
A
t
x, Int
med
(x) =
A
t
A
t
+ 1
x.
(5.9)
Las expresiones de arriba en (5.9) son aproximadas, mientras que las de abajo
nos dan el valor exacto si sustituimos A
t
por su valor, expresado en d́ıas medios.
Nótese que la función Int
sid
() es la inversa de Int
med
().
Las funciones anteriores nos van a permitir transformar el tiempo universal, en
cualquiera de sus versiones, en tiempo sidéreo y viceversa. Para ello, supongamos
un lugar de longitud � y un instante caracterizado por una hora sidérea LMST ,
una hora de tiempo civil T
c
y una hora de tiempo universal UT . A partir de ahora
usaremos UT sin especificar si es UT1 o UT0 , pues la elección dependerá de si la
longitud está o no corregida por el movimiento del polo.
Llamaremos GMST
0
a la hora GMST cuando sean las 0h de tiempo univer-
sal, esto es, cuando comience el d́ıa medio en el meridiano origen. Fácilmente se
comprueba que en ese instante, la hora sidérea local será LMST
0
= GMST
0
+ �.
Para calcular la hora sidérea en el instante UT habrá que añadir a LMST
0
el
intervalo de tiempo sidéreo correspondiente a las horas de UT transcurridas, esto
es,
LMST = GMST
0
+ �+ Int
sid
(UT ), (5.10)
relación fundamental que permite pasar de tiempo universal a tiempo sidéreo.
De un modo sencillo podemos invertir la anterior relación, obteniendo la fórmu-
la de paso de tiempo sidéreo a universal
UT = Int
med
(LMST �GMST
0
� �). (5.11)
84 Referencia temporal
Notemos que para convertir tiempo sidéreo a universal es necesario el valor
de GMST
0
, esto es, el tiempo sidéreo en Greenwich a las cero horas de UTde un
determinado d́ıa. El valor de GMST
0
, acorde con el modelo de precesión del año
2000 es igual a
GMST
0
= 361658.002406561 + 129598159.007606402Tu
s
+ 4612.0015739966T
s
+
1.0039667721T 2
s
� 0.0000009344T 3
s
+ 0.0000001882T 4
s
,
(5.12)
donde T
s
y Tu
s
representan el UT1 y TT 4 ambos expresados en siglos julianos
desde J2000.0.
5.5 Escalas de tiempo uniforme
La Mecánica de Newton admite la existencia de un tiempo uniforme y absoluto
que es el usado en las ecuaciones del movimiento de los cuerpos. Durante siglos,
la rotación terrestre ha sido considerada uniforme y por ello el tiempo que de
ella se ha derivado, UT , se ha supuesto coincidente con el tiempo absoluto de
la Mecánica. Sin embargo, a finales del siglo XVII, Flamstead ya sugirió que la
rotación de la Tierra podŕıa cambiar de estación en estación, debido a las masas
de aire y agua que la envuelven y que se desplazan en las distintas estaciones del
año.
El desarrollo de la Mecánica Celeste permitió lograr, a comienzos del presente
siglo, unas teoŕıas del movimiento de los planetas suficientemente precisas para
comprobar que la rotación de la Tierra no es un fenómeno totalmente uniforme.
En efecto, Newcomb observó un desfase entre la observación de los planetas y sus
posiciones calculadas. Posteriores investigaciones han llevado a la conclusión de
que la Tierra se retrasa en su rotación unos 30s por siglo.
5.5.1 Tiempo de efemérides y tiempo atómico internacional
La Astronomı́a, necesitada de mayor precisión en los cálculos, definió una
nueva escala de tiempo, el tiempo de efemérides, ET , basada en la dinámica
del sistema solar y uniforme por definición. La Mecánica Celeste fue la ciencia
encargada de medir el desfase
�T = ET �UT , (5.13)
entre el tiempo de efemérides y el tiempo universal que continúa siendo el tiempo
tomado como base para las aplicaciones en la vida civil.
La época origen desde la que se mide el tiempo de efemérides es el instante de
la media noche media (H
m
= 12h) del d́ıa que comienza el año 1900. Teniendo en
4Ver apartado 5.6
Escalas de tiempo uniforme 85
cuenta la duración del año trópico de 1900, igual a 365.242198781 d́ıas medios, la
Unión Astronómica Internacional (IAU) eligió, en 1956, como unidad fundamental
de tiempo el segundo, definido como la fracción 1/31556925.975 de la duración
del año trópico de 1900. Esta unidad, puesto que se refirió a un año concreto, es
independiente de la rotación terrestre y del año que se considere.
En 1900, dos relojes, uno de UTy otro de ET debeŕıan marcar la misma hora,
pero en el momento en que se definió el ET hab́ıa un desfase entre ellos de unos
32.s184 debido al deceleración en rotación de la Tierra.
Al contrario de los tiempos definidos hasta aqúı, que conllevan una inexactitud
asociada a la no periodicidad del fenómeno por medio del cual se definen, el ET es
uniforme por definición, aunque su medida, basada en la observación y el cálculo
de las posiciones de los planetas, no es exacta. Sin embargo, el avance es sustancial,
pues cualquier mejora en la medida, cient́ıfica o tecnológica, supone un progreso en
la exactitud del tiempo obtenido, mientras que antes siempre nos encontrábamos
con la inexactitud propia del fenómeno que define el reloj.
La medida del tiempo basado en el tiempo de efemérides estuvo vigente hasta
1967, año en que se introduce oficialmente el tiempo atómico internacional (TAI ),
basado en fenómenos cuánticos propios del interior de la materia. La unidad bási-
ca del TAI es el segundo atómico internacional que se define como la duración
de 9192631770 periodos de la radiación correspondientea la transición entre los
dos niveles hiperfinos del estado fundamental del átomo de Cesio 133. Este se-
gundo, que es la unidad de tiempo en el sistema internacional (SI), se definió de
modo que su duración coincidiera con la del segundo de efemérides establecida
anteriormente.
La mayor precisión conseguida en la medida de TAI por medio de los relojes
atómicos aconsejó la utilización de este tiempo como estándar a partir de 1967.
La siguiente tabla nos da una idea de la precisión de estos relojes:
Reloj Pérdida de un segundo en
ET , Cristal de cuarzo 30 años
Rubidio 30000 años
Cesio 300000 años
Maser hidrógeno 30000000 años
El tiempo de efemérides y el tiempo atómico internacional son, en teoŕıa, el
mismo tiempo uniforme, pero con objeto de ajustar el TAI a UT , hubo que tener
en cuenta el desfase entre el UTy el ETy eso hizo que las escalas no tuviesen el
mismo origen. Por ello, en la Asamblea General de la IAU de 1976 en Grenoble,
se adoptó la resolución de que el instante 00h00m00.s00 del 1 de Enero de 1977
TAI sea el 00h00m32.s184 del 1 de Enero de 1977 del correspondiente a la escala
ET con lo que se tiene que
ET = TAI + 32.s184. (5.14)
86 Referencia temporal
5.5.2 Tiempo universal coordinado
A pesar de la variedad de tiempos que hemos definido, aún no hemos llegado
al tiempo que realmente estamos utilizando en nuestra vida cotidiana. Para ello
vamos a dar antes un par de definiciones aplicables a cualquier reloj y analizaremos
su significado.
Llamaremos estado de un reloj, E.R., a la diferencia entre la hora que marca
el reloj y la hora exacta.
Un valor positivo del estado de un reloj corresponde a un reloj adelantado,
mientras que un valor negativo indica que el reloj está atrasado (Figura 5.6(a)).
Zona de atraso
Zona de adelanto�t
(a) Estado
Reloj 1
Reloj 2
Reloj 3
(b) Marcha
Figura 5.6: Estado y marcha de un reloj. En ambas figuras el eje horizontal representa
la hora exacta, mientras que el eje vertical representa la hora marcada por el reloj.
Llamaremos marcha de un reloj, m, a la variación del estado del reloj en un
cierto intervalo de tiempo
m =
E.R.
2
� E.R.
1
t
2
� t
1
,
es decir, lo que el reloj adelanta o atrasa en dicho intervalo (d́ıa, año, etc.).
La gráfica 5.6(b) nos muestra tres tipos diferentes de relojes. El reloj 1 es un
reloj que tiene un estado constante, esto es, una marcha nula. Este reloj es un
reloj uniforme pero que mantiene una diferencia constante con la hora exacta.
El reloj 2, tiene una marcha constante, atrasa una cantidad de tiempo constante
cada cierto periodo de tiempo, al cabo del cual, el reloj es puesto de nuevo en
hora. Por último, el tercer reloj muestra un reloj de marcha constante pero no
corregida, por lo que su estado es cada vez mayor.
Con estas ideas podemos ilustrar el comportamiento de nuestros relojes de
TAI , ETy UTen la figura 5.7.
Despreciando la marcha del TAI (1s cada 30000000 años), éste será tomado
como tiempo uniforme. El tiempo efemérides, por definición, es también uniforme;
sin embargo, su estado es constantemente igual a 32.s184 que corresponde a un reloj
Escalas de tiempo uniforme 87
ET
TAI
UTC
Figura 5.7: Tiempo universal coordinado.
como el del tipo primero de la Figura 5.6(b). Por su parte, el tiempo universal va
manteniendo una marcha no nula, debido a la variación de la velocidad de rotación
de la Tierra. Evidentemente, este reloj (es la Tierra) no puede ser corregido, por
lo que es similar al del tipo 3 mostrado en la Figura 5.6(b).
Aśı pues, tenemos por un lado un reloj atómico, casi perfecto, y que de mo-
mento, es el tipo de tiempo que se puede medir con mayor precisión, y un mal
reloj, formado por la Tierra y el Sol, pero que rige la vida diaria y las costumbres
humanas. Se hace necesario, por tanto, relacionar este tiempo TAI con el UT ,
menos consistente y determinado a partir de la rotación de la Tierra. Esta relación
se obtiene con un nuevo tiempo, el llamado tiempo universal coordinado5, UTC ,
introducido en 1972, a caballo entre el TAI y el UT , puesto que prácticamente
es el TAI y apenas se desv́ıa del UT1 . Este nuevo tiempo, UTC , cumple las
siguientes condiciones:
1. Su diferencia, DUT1 , con el tiempo universal debe ser siempre inferior a
0.s9, esto es, DUT1 = UT1 �UTC < 0.s9.
2. Su diferencia, DTA = TAI -UTC , con el tiempo atómico internacional debe
ser un número entero de segundos.
Esto se consigue mediante un segundo intercalar, de modo análogo a como sucede
con los años. Cuando la diferencia DUT1 va a exceder 0.s9, se añade un segundo.
Este segundo intercalar, normalmente, se le añade al último minuto del año en
diciembre, o al último minuto de junio, lo que se anuncia con suficiente antelación
por los organismos encargados del tiempo. En el momento de terminar este libro
5También llamado a veces tiempo zulú y GMT , aunque este nombre ya hemos dicho antes
que es confuso y por ello desaconsejado.
88 Referencia temporal
el valor de DTA es de 35s con el último segundo intercalar introducido el 30 de
Junio de 2012.
El UTCes el tiempo difundido por las señales horarias con una precisión de
±0.s00002 y es tomado como base para definir la hora oficial de cada páıs o zona.
5.5.3 Tiempo de zona y tiempo oficial
El tiempo universal coordinado nos da un tiempo medio común, pero refe-
rido al meridiano origen. Un sistema de estándares para todo el globo terrestre
está basado en las zonas o husos horarios, basados en incrementos de 15� (una
hora) de longitud, aunque, en la práctica, son los gobiernos de los distintos páıses
quienes decretan el llamado tiempo de zona (ZT ), tomando generalmente como
base un número entero de horas que represente la longitud media �
m
de una zona
o páıs determinado, de modo que
ZT = UTC + �
m
. (5.15)
Sin embargo, este tiempo de zona no suele ser el que un páıs adopta para su terri-
torio, la llamada hora oficial, sino que ésta se regula mediante criterios poĺıticos
o económicos. Aśı, hora oficial española (TE ), viene dada como:
TE
invierno
= UTC + 1h, TE
verano
= UTC + 2h,
siendo TE
invierno
la hora oficial desde el último domingo del mes de octubre al
último domingo del mes de marzo, y TE
verano
la del resto del año. La diferencia de
longitud obliga a definir una hora menos para Canarias. Notemos que realmente,
nuestro tiempo de zona no corresponde con nuestro huso horario (el meridiano
de Greenwich pasa por la peńınsula), sino que llevamos el llamado CET (Central
European Time), el tiempo de la zona de la Europa central.
5.6 Escalas modernas de tiempo
Tanto el TAI como el ET son esencialmente el mismo tiempo dentro del
contexto de la mecánica newtoniana, pues ambos señalan un tiempo absoluto. La
IAU en el año 1976, considerando la precisión alcanzada entonces en la medida
del tiempo, señaló la necesidad de introducir las variaciones de tiempo derivadas
de la teoŕıa de la relatividad.
Ambos tiempos están medidos desde un observatorio terrestre en movimiento
y, por lo tanto, son distintos de los que se mediŕıan desde otro lugar, como el
baricentro del sistema solar. Esto resulta de particular importancia si pensamos
en que todas la teoŕıas dinámicas del movimiento de los planetas, a partir de las
que se obtiene el tiempo de efemérides, están formuladas tomando como origen
del sistema de referencia el baricentro del sistema solar.
Escalas modernas de tiempo 89
Para resolver esta ambigüedad se definieron dos nuevas clases de tiempo, que
están vigentes a partir del año 1984. Estos nuevos tiempos son llamados tiempo
terrestre, TT , (anteriormente llamado tiempo dinámico terrestre, TDT ), y el
tiempo dinámico baricéntrico, TDB .
El tiempo terrestre coincide exactamente con el tiempo de efemérides y no es
sino una continuación del ET a partir del 1 de Enero de 1977. De ah́ı que su
relación con el TAI sea
TT = TAI + 32.s184. (5.16)
El tiempo dinámico baricéntrico (TDB ) es la variable independiente de la
ecuaciones del movimientocon respecto al baricentro del sistema solar. La in-
troducción de TT viene condicionada por la necesidad de un tiempo en el cual
se formulen las ecuaciones geocéntricas del movimiento, en contraposición con el
tiempo de las ecuaciones baricéntricas TDB . En los anuarios astronómicos, to-
das las efemérides referidas a posiciones geocéntricas vienen expresadas en TT ,
mientras que las referidas a posiciones baricéntricas vienen en TDB .
La aplicación de la teoŕıa de la relatividad a las ecuaciones del movimiento pla-
netario permite obtener las relaciones entre TTy TDB que, simplificada, puede
ponerse como
TDB = TT + 0.s001658 sen(g + 0.0167 sen g),
con g = 357.�53+35999.�050T
s
. En la expresión anterior faltan los términos lunares
y planetarios que son del orden de 0.s00001 y los diarios, del orden de 0.s000001.
Teniendo en cuenta las relaciones entre los tiempos TT , ETy TAI podemos
obtener la relación
�T = TT �UTC = DTA + 32.s184, (5.17)
que, a partir del segundo intercalar introducido a mediados del año 2012 es de
67.s184.
Desde el año 1980, atendiendo a la importancia creciente del uso de la conste-
lación de satélites GPS, se ha definido un nuevo tiempo, el llamado tiempo GPS
(GPST ), que es el emitido por dichos satélites. Este tiempo está también medido
con relojes atómicos y difiere del TAI en una cantidad constante de 19s
GPST = TAI � 19s. (5.18)
De esta forma la introducción de segundos intercalares producirá una diferencia
variable de un número entero de segundos con el UTC . Esta diferencia, será
GPST �UTC = DTA � 19s, (5.19)
o lo que es igual, 16s desde el 1 de Julio de 2012.
90 Referencia temporal
5.7 Tiempos coordenada
El tiempo coordenada representa la coordenada tiempo de los sistemas relati-
vistas baricéntrico y geocéntrico. El tiempo coordenada baricéntrico (TCB ) es el
tiempo del sistema BCRS, mientras que el tiempo coordenada geocéntrico (TCG )
es el tiempo del sistema GCRS.
De acuerdo con las definiciones de la IAU la relación entre el TCG y el
TTviene dada por la expresión
dTT
dTCG
= 1� L
G
,
donde L
G
es una constante adimensional fundamental cuyo valor es 6.969290134⇥
10�10.
Estableciendo un instante inicial e integrando se obtiene la relación
TCG � TT = L
G
(JD
TT
� 2443144.5)⇥ 86400, (5.20)
donde la diferencia viene dada en segundos.
El primer orden de la relación entre el TCB y el TCG es
TCB � TCG = L
C
(JD
TT
� 2443144.5)⇥ 86400, (5.21)
siendo L
C
= 1.48082686741 ⇥ 10�8. Esta diferencia tiene además otros términos
no lineales que no se han escrito.
5.8 Calendario
Para referir cronológicamente los acontecimientos históricos se construyeron
calendarios que tratan de combinar los conceptos básicos de d́ıa y año para esta-
blecer referencias que permitan identificar instantes concretos del tiempo o épocas.
La duración del año no es un número entero de d́ıas, por lo que la creación de
calendarios ha sido una labor compleja. Estudiaremos aqúı únicamente el calen-
dario en vigor en el mundo occidental, aunque resulta muy interesante realizar un
análisis del resto de calendarios.
El calendario intenta reproducir el año trópico, pues de esta forma el comienzo
de las estaciones tendrá lugar siempre en las mismas fechas del año. La duración
aproximada del año trópico es de 365.2422 d́ıas medios, lo que llevó a Julio César—
a instancias de Sośıgenes— a la promulgación del calendario juliano, constituido
por ciclos de tres años de 365 d́ıas y otro, llamado año bisiesto, de 366 d́ıas. En
promedio, el año del calendario Juliano tiene una duración de 365.25 d́ıas. Esta
cantidad es muy próxima a la duración del año trópico, pero lleva un desfase de
0.0078 d́ıas al año o lo que es igual, de casi un d́ıa cada 128 años.
Determinación de una época 91
Este desfase, con el paso del tiempo, se fue haciendo cada vez más evidente,
de modo que los comienzos de las estaciones se adelantaban varios d́ıas. Esto,
junto con el hecho de volver a tener la fecha de Pascua en las fechas esperadas6,
motivó una profunda reforma del calendario, impulsada por el papa Gregorio
XIII, que se conoce con el nombre de Reforma Gregoriana. Al calendario que
se adoptó se le dio el nombre de calendario gregoriano. Este reforma corrigió el
desfase acumulado e intentó paliar en lo posible el desfase para los años venideros.
Como en el año 1512 la primavera comenzaba el 11 de marzo, la reforma
gregoriana dispuso, en primer lugar, la desaparición de 10 d́ıas, por lo que al 4
de octubre de 1582 le siguió el 15 de octubre de 1582, con lo que se restauraba
el equinoccio al 21 de marzo. Además, se siguió con el sistema de años bisiestos,
pero de modo que los últimos años de siglo (años que acaben en 00) , no serán
bisiestos, excepto aquellos múltiplos de 400. De esta forma, no fueron o no serán
bisiestos los años 1700, 1800, 1900, 2100, 2200, 2300, etc., aunque śı los años 1600,
2000, 2400, etc. Con este método, la duración del año es de 365.2425 d́ıas, por lo
que se acumula un error de 1 d́ıa en 3314 años, que podŕıa ser recogido con una
nueva reforma, pero dado que el número de años que han de transcurrir para que
tenga lugar ese desfase, se optó por dejarlo aśı.
Como el motivo principal de esta reforma fue religioso, inicialmente fue acep-
tada sólo por los páıses católicos romanos. Los páıses protestantes la introdujeron
bastantes años más tarde y los ortodoxos incluso la rechazaron hasta comienzos
del siglo XX.
5.9 Determinación de una época
Una vez establecido el calendario, una fecha se localiza mediante el d́ıa, mes
y año y se se quiere precisar más, la hora. Desde el punto de vista astronómico,
expresaremos un instante o época, T , dando los datos correspondiente en el si-
guiente orden: año, mes, d́ıa y hora. Aśı hablaremos del 2000 Enero 1 a las 12h
UTC como el mediod́ıa del uno de Enero del año 2000. En ocasiones, también
emplearemos el número 0 para indicar el d́ıa, aśı Enero 0 a las 12h corresponde al
31 de Diciembre a las 12h. Sin embargo, desde un punto de vista matemático, este
uso del calendario, no es muy práctico; basta simplemente con calcular el intervalo
de tiempo transcurrido entre dos fechas separadas varios meses para constatar lo
tedioso que resulta la operación, puesto que hay que tener en cuenta el número
de d́ıas que tiene cada mes y si aparece involucrado algún año bisiesto o no en
el lapso de tiempo considerado. Una escala continua simplificaŕıa notablemente el
cálculo. Esto se consiguió con el llamado periodo juliano, propuesto por Scaliger
en 1582, y que recibe el nombre por su padre, Julio Scaliger.
6En el Concilio de Nicea se estableció que la Pascua de Resurrección se celebrase el domingo
siguiente al primer plenilunio después del 21 de Marzo.
92 Referencia temporal
El periodo juliano es una escala continua de tiempo, con su origen en el 4713
A.C. Enero 1d.5, esto es a las 12h TTdel d́ıa 1 de Enero del año -4712 del calen-
dario Juliano proléptico7, de modo que los años tienen una duración fija de 365.25
d́ıas. Este punto inicial, aparentemente caprichoso, fue una cuidadosa elección por
parte de Scaliger de tres ciclos: el ciclo solar de 28 años (cuando los d́ıas de la
semana y las fechas del calendario se repiten en el calendario Juliano), el ciclo
de 19 años de los números áureos (cuando las fases de la luna se repiten en las
mismas fechas del calendario) y el ciclo de 15 años de indicción (ciclo de impuestos
romano).
El número de d́ıa juliano (JDN) correspondiente a un d́ıa solar es el número
entero de d́ıas transcurridos entre la época origen y el mediod́ıa de ese d́ıa. El
modo de calcular el JDN es simple: supongamos que queremos calcular el JDN
del 1 de Enero de 1998, para ello basta con calcular el número de años transcurrido
desde el origen, multiplicar por 365.25, tomar el entero por exceso de la operación,
restar el número de d́ıas suprimidos mediante la reforma gregoriana y añadirel
número de d́ıas dentro del año. En nuestro ejemplo, es 4712 + 1998 = 2450827.5,
cuyo entero por exceso es 2450828. A este número hay que restarle 13 d́ıas (10
de la reforma y tres por 1700, 1800 y 1900 que no fueron bisiestos), con lo que
obtenemos 2450815.
La fecha juliana (JD) de un instante, es el número de d́ıa juliano de ese d́ıa,
más la fracción de d́ıa desde el mediod́ıa hasta ese instante. Puesto que en la
determinación de la fecha juliana se utiliza la hora, la IAU recomienda usar como
tiempo el TT , aunque pueden usarse otros tipos de tiempo como el UT1 , UTC ,
etc. En estos casos, además de las correcciones oportunas, habrá que especificar
el tipo de tiempo usado, por ello hablaremos del JD
TT
, JD
UT1
, JD
UTC
, etc. Si
no se especifica nada se entiende que JD = JD
TT
.
Siguiendo con el mismo ejemplo de antes el 1 de Enero de 1998 es 2450815,
luego para encontrar la fecha juliana de ese mismo d́ıa a las 0h TTse deberá restar
0.5 a dicho número pues es la fracción de d́ıa que falta hasta las 12h TT. Aśı pues
tendremos que la fecha juliana será 2450814.5 y se representará por las letras JD
seguidas de ese número JD 2450814.58.
La fecha juliana almacena en un solo número real toda la información necesaria
para determinar cualquier instante o época histórica. La parte entera lleva la
información del d́ıa y la parte decimal de la hora. Este procedimiento limita,
desde el punto de vista informático, la precisión en la determinación de la época.
Por ejemplo en la época actual, y aproximadamente hasta el año 22666, se precisan
siete d́ıgitos para el d́ıa, por lo que si almacenamos el dato en una variable de
doble precisión de un ordenador nos quedan unos 7 u 8 d́ıgitos para la hora, lo
que supone una precisión aproximada de unos 0.s01.
7El calendario juliano proléptico contiene año cero, de forma que el año 1 A.C. corresponde
con el año 0, el 2 A.C. con el -1, etc.
8En la página web http://aa.usno.navy.mil/faq/docs/JD Formula.php puede verse una sen-
cilla fórmula, y su algoritmo escrito en FORTRAN, para realizar este cálculo.
Determinación de una época 93
Con objeto de reducir el número de d́ıgitos necesarios para almacenar el d́ıa
y que la fecha juliana comience a medianoche, se suele usar, siempre que no haya
lugar a confusión, la fecha juliana modificada (MJD), que no es sino la fecha
juliana (JD) menos 2 400 000.5. En nuestro ejemplo, la MJD correspondiente al 1
de Enero de 1998 a las 0h es 50814.0. Con esto aumentamos a 0.s0001 la precisión en
el almacenamiento de la hora. Si se quiere más precisión será necesario almacenar
por separado el d́ıa y la hora.
Existen otras dos formas de caracterización de una época basadas en el con-
cepto de año en lugar del d́ıa. Fueron desarrolladas para establecer la variable
temporal de las teoŕıas dinámicas del sistema solar. Para ello, además de carac-
terizar la época se establecieron épocas estándar de referencia desde donde se
med́ıan peŕıodos de tiempo.
Con anterioridad a 1976, la época estándar estaba basada en el llamado año
beseliano. Bessel definió éste como un año de duración idéntica al año trópico
y que comienza en el instante en que la ascensión recta del Sol medio, afectada
por aberración y contada desde el equinoccio medio es de 280�. Esta elección
aparentemente artificial está hecha con la intención de aproximar al máximo el
comienzo del año trópico con el del calendario.
El año beseliano se representa con una B seguida de un número que indica el
año beseliano y un decimal para la fracción de año trópico transcurrida desde el
comienzo del año beseliano. Aśı B1900.0 representa exactamente el comienzo del
año beseliano 1900, mientras que B1900.5 representa medio año trópico después.
Con esta notación, para establecer un intervalo de tiempo entre dos épocas basta
con restar las cantidades y conocer la duración del año trópico. La primera época
origen estándar establecida fue B1900.0 y representa el instante B1900.0 = 1900
Enero 0d.813 ET . Posteriormente, hacia la mitad del siglo XX, se usó B1950.0
como época estándar.
La duración variable del año trópico hace dif́ıcil la medición de intervalos
entre dos épocas. Esto aconsejó buscar un nuevo método de representación de
una época, basado esta vez en el año juliano, que se representa con una J seguida
de un número que representa el año y un decimal que representa la fracción de
año juliano desde el comienzo de éste. La época estándar establecida en 1976
fue la época J2000.0, que es el año 2000 Enero 1 a las 12h TDB , es decir, el
JD 2451545.0, que ya nos ha aparecido en alguna fórmula de este caṕıtulo y el
anterior.
Este nuevo sistema se adapta muy bien al uso del d́ıa como unidad para expre-
sar un cierto intervalo de tiempo, lo que resulta muy conveniente en determinado
tipo de observaciones. Además, para sustituir el lapso de tiempo transcurrido en
las fórmulas mencionadas, basta con calcular la fecha juliana del d́ıa requerido y
sustraerla de la del instante J2000.0.
94 Referencia temporal
Las épocas fundamentales pueden ponerse en la forma:
B1900.0 = JD2415020.31352,
J2000.0 = JD2451545.0,
por lo que las relaciones entre las tres formas de caracterizar una época se expre-
sarán como:
B = 1900.0 +
JD� 2415020.31352
365.24219878
,
J = 2000.0 +
JD� 2451545.0
365.25
.
(5.22)
A partir del año juliano puede definirse la variable T
s
, que se usa habitualmente
en las teoŕıas dinámicas y que hemos utilizado en el caṕıtulo anterior y en éste,
como la fracción de siglo juliano desde la época J2000.0,es decir
T
s
=
JD� 2451545
36525
. (5.23)
Parte II
Movimiento kepleriano
95
Caṕıtulo 6
Revisión de elementos de
dinámica clásica
6.1 Introducción
Este caṕıtulo contiene un rápido repaso a algunos de los conceptos funda-
mentales de la Mecánica, necesarios para poder comprender parte de este libro y
expresados con una notación adaptada a éste. Su presentación, en algunos casos,
no es muy detallada, pues esto nos llevaŕıa a una complicación innecesaria para
nuestros objetivos. Remitimos al lector a libros especializados del tema para una
mejor comprensión del mismo.
6.2 Movimiento de una masa puntual
Supongamos un punto P que se mueve en el espacio y cuya posición, con
respecto a un cierto origen O, viene dada por un vector x(t) = OP , llamado
vector de posición. Éste vaŕıa con respecto a una variable independiente t que
llamaremos tiempo y que será considerado absoluto1 de acuerdo con los axiomas
de la Mecánica enunciados por Newton.
Si establecemos un sistema de referencia S = {O, e
1
, e
2
, e
3
}, en el cual el vec-
tor de posición se expresa como x(t) = x
1
(t) e
1
+ x
2
(t) e
2
+ x
3
(t) e
3
, llamaremos
trayectoria relativa al sistema S a la curva (x
1
(t), x
2
(t), x
3
(t)), dada en coordena-
1Independiente de las condiciones cinemáticas y dinámicas del observador.
98 Revisión de elementos de dinámica clásica
das paramétricas y definida en el intervalo I = [t
0
, t
1
] 2 IR. Si la curva se reduce
a un punto, diremos que la part́ıcula está en reposo o equilibrio.
Llamaremos velocidad del punto al vector X(t) que determina la variación de
x(t) con respecto al tiempo
X(t) = ẋ(t) =
dx(t)
dt
.
El lugar geométrico de los extremos del vector velocidadX(t) es llamado hodógra-
fa. Si la velocidad de un punto es un vector constante diremos que el movimiento
es uniforme. De aqúı en adelante el punto, o puntos, encima de la variable repre-
sentarán las derivadas respecto a t.
Llamaremos aceleración del punto al vector a(t) que determina la variación
de X(t) con respecto al tiempo
a(t) = Ẋ(t) = ẍ(t).
Un movimiento uniforme viene caracterizado por una aceleración nula.
Los tres conceptos anteriores son puramente geométricos y definen la cinemáti-
ca del punto P . Si al punto P le añadimos el concepto de masa m, como una
constante asociada al punto, podremosllamar a P part́ıcula material y esto nos
permitirá definir dos nuevos conceptos que caracterizarán la dinámica del punto:
el momento lineal y el momento angular.
Se denomina momento lineal, o cantidad de movimiento, de una part́ıcula P ,
de masa m, al vector p = mX. Por otro lado, llamaremos momento angular de
P al vector G = x⇥ p = m(x⇥X).
Newton establece el concepto de fuerza como la variación de la cantidad de
movimiento de una part́ıcula, esto es,
F = ṗ = mẊ = ma, (6.1)
que es la ecuación fundamental de Newton de la Mecánica. Si conocemos la fuerza
que actúa sobre una part́ıcula, el conjunto de tres ecuaciones diferenciales de orden
dos (6.1), junto con unas condiciones iniciales x(t
0
),X(t
0
), permite averiguar, por
integración, la trayectoria de la part́ıcula.
Aunque el movimiento sea espacial, esto es, no esté restringido a un plano,
siempre puede considerarse como instantáneamente plano, puesto que en cada
instante la part́ıcula se encuentra en el plano instantáneo definido por los vectores
de posición y velocidad. La dirección del vector momento angular G, que es por
definición perpendicular a x y X, define el plano instantáneo del movimiento, es
por ello que si el momento angular de una part́ıcula tiene dirección constante, su
movimiento es plano.
Sistemas inerciales y no inerciales 99
x
�x
V
A
O
P
Q
Figura 6.1: Velocidad areolar.
La norma del momento angular pue-
de ponerse como kG k = 2mkV
A
k,
donde V
A
= (x ⇥ X)/2 es la llama-
da velocidad areolar de P . Su significa-
do geométrico es evidente si recordamos
que dado el vector
�� =
1
2
(x⇥�x),
su norma k�� k mide el área del
triángulo OPQ de la figura 6.1. Pasando
al ĺımite tendremos
ĺım
�t!0
��
�t
= ĺım
�t!0
1
2
(x⇥ �x
�t
) =
1
2
(x⇥X) = V
A
.
Aśı pues, V
A
mide el área elemental barrida por el vector de posición. Cuando
la velocidad areolar, o lo que es igual el módulo del momento angular, es constante,
se dice que P cumple la ley de las áreas.
6.3 Sistemas inerciales y no inerciales
Otro de los principios establecidos por Newton garantiza la existencia de cier-
tos sistemas de referencia, que llamaremos sistemas inerciales, con respecto a los
cuales una part́ıcula libre2 se mantiene en reposo o se mueve con una trayectoria
rectiĺınea y uniforme.
Para comprender mejor el concepto de sistema inercial supondremos que existe
un punto fijo F , en el espacio, y tres direcciones ortogonales fijas dadas por los
vectores {f
1
,f
2
,f
3
} con las que definiremos un sistema de referencia fijo F =
{F,f
1
,f
2
,f
3
}, en el que la posición, velocidad y aceleración de un punto P
vendrán dadas por: r = FP ,v = ṙ,a = r̈.
Sea otro sistema de referencia, S = {O, s
1
, s
2
, s
3
}, en el que tanto el origen
O como las direcciones de los vectores de la base pueden moverse. Puesto que
consideramos sistemas de referencia ortonormales, la única forma que tienen de
moverse los vectores de la base es que ésta gire. Este movimiento implica que se
verifiqua la condición ṡ
i
6= 0. Si ṡ
i
= 0 diremos que el sistema se traslada.
Llamaremos x
o
= FO al vector de posición del origen del sistema S respecto
del sistema fijo F . Su velocidad y aceleración vendrán dadas por los vectores
v
o
= ẋ
o
,a
o
= ẍ
o
.
Si el sistema S gira se tendrá ṡ
i
6= 0 y por tanto se podrá poner ṡ
i
=
P
3
j=1
a
ij
s
j
, donde fácilmente puede comprobarse que se verifica a
ij
= ṡ
i
· s
j
.
2Part́ıcula sobre la que no actúa ninguna fuerza externa.
100 Revisión de elementos de dinámica clásica
Por otro lado, puesto que consideramos únicamente sistemas ortonormales, se
verificarán las relaciones s
i
· s
i
= 1, s
i
· s
j
= 0, que derivadas conducen a
2ṡ
i
· s
i
= 0, ṡ
i
· s
j
+ s
i
· ṡ
j
= 0, o lo que es igual a a
ii
= 0, a
ij
+ a
ji
= 0.
Llamando ahora !
3
= a
12
,!
2
= �a
13
,!
1
= a
23
, podremos poner finalmente
0
@
ṡ
1
ṡ
2
ṡ
3
1
A =
0
@
0 !
3
�!
2
�!
3
0 !
1
!
2
�!
1
0
1
A
0
@
s
1
s
2
s
3
1
A ,
o lo que es igual
ṡ
i
= ! ⇥ s
i
, (6.2)
donde el vector ! =
P
3
i=1
!
i
s
i
será llamado velocidad angular del sistema. Las
ecuaciones (6.2), llamadas fórmulas de Poisson, caracterizan la rotación de un
sistema de referencia.
Llamaremos x al vector OP , esto es, al vector de posición de P cuyas compo-
nentes en el sistema S son (x
1
, x
2
, x
3
). Para calcular la velocidad y aceleración de
P relativa al sistema S bastará derivar x respecto al tiempo con lo que tendremos
ẋ =
3
X
i=1
ẋ
i
s
i
+
3
X
i=1
x
i
ṡ
i
= x
0 +
3
X
i=1
x
i
(! ⇥ s
i
) = x
0 + ! ⇥
3
X
i=1
x
i
s
i
,
donde, de aqúı en adelante, llamaremos x
0 =
P
3
i=0
ẋ
i
s
i
, esto es, al resultado de
derivar las tres componentes del vector sin considerar la variación de los vectores
de la base. Aśı llegamos a la expresión
ẋ = x
0 + ! ⇥ x. (6.3)
Esta expresión puede usarse para el cálculo de la derivada segunda obteniéndose
finalmente
ẍ =
dx0
dt
+
d(! ⇥ x)
dt
= (x00 + ! ⇥ x
0) + !
0 ⇥ x+ ! ⇥ (x0 + ! ⇥ x)
= x
00 + 2! ⇥ x
0 + !
0 ⇥ x+ ! ⇥ (! ⇥ x),
(6.4)
donde hemos tenido en cuenta que de acuerdo con (6.3) !̇ = !
0.
Las ecuaciones anteriores permiten obtener la velocidad y aceleración de un
punto P , relativa a un sistema S, como:
ẋ = x
0 + ! ⇥ x,
ẍ = x
00 + 2! ⇥ x
0 + !
0 ⇥ x+ ! ⇥ (! ⇥ x).
(6.5)
Ahora ya estamos en condiciones de relacionar la posición, velocidad y acele-
ración de P en los sistemas fijo y móvil. Para ello, a partir de la relación entre las
posiciones
r = FP = FO +OP = x
o
+ x,
Movimiento de una part́ıcula en su plano 101
obtendremos la velocidad
v = ṙ = ẋ
o
+ ẋ = v
o
+ x
0 + ! ⇥ x,
y finalmente la aceleración
a = r̈ = ẍ
o
+ ẍ = a
o
+ x
00 + 2! ⇥ x
0 + !
0 ⇥ x+ ! ⇥ (! ⇥ x).
La expresión anterior para la aceleración puede expresarse en la forma
a = x
00 + a
a
+ a
c
+ a
o
, (6.6)
siendo x
00 la aceleración relativa, a
c
= 2! ⇥ x
0, la aceleración de coriolis, a
a
=
!
0 ⇥ x+ ! ⇥ (! ⇥ x), la aceleración de arrastre y a
o
la aceleración del origen.
La ecuación fundamental de Newton (6.1) se expresará finalmente como
F = ma = mx
00 +ma
a
+ma
c
+ma
o
, (6.7)
lo que muestra que la formulación de las ecuaciones del movimiento en un sistema
fijo y otro móvil es distinta pues en el móvil a la aceleración relativa (o vector de
las derivadas segundas de las componentes) debemos añadir las aceleraciones del
origen, de arrastre y de coriolis.
El concepto de sistema móvil, utilizado en el párrafo anterior, queda muy
impreciso. Podemos precisarlo más atendiendo a la propia ecuación (6.7). Diremos
que un sistema S es inercial si las ecuaciones del movimiento de un punto P en
dicho sistema se pueden expresar como F = mẍ = mx
00, esto es, cuando las
aceleraciones de arrastre, de coriolis y del origen son nulas. Esto ocurre únicamente
cuando el origen tiene un movimiento rectiĺıneo y uniforme (a
o
= 0) y cuando los
ejes del sistema no rotan (! = 0), esto es, cuando el sistema está fijo o se traslada
con un movimiento rectiĺıneo y uniforme.
De aqúı en adelante supondremos la existencia de un sistema inercial S =
{O, e
1
, e
2
, e
3
} que llamaremos sistema espacial. En este sistema se tendrá x =
P
3
i=0
x
i
e
i
, ẋ = x
0 =
P
3
i=0
ẋ
i
e
i
y ẍ = x
00 =
P
3
i=0
ẍ
i
e
i
. Por tanto, las ecuaciones
del movimiento vendrán dadas por
F = mẍ. (6.8)
6.4 Movimiento de una part́ıcula en su plano
Hemos dicho anteriormente que el movimiento de la part́ıcula tiene lugar en
un plano, no necesariamente fijo, definido por el vector G. Con objeto de simpli-
ficar algunas de las propiedades del movimiento será conveniente definir nuevos
sistemas de referencia, que pueden no ser inerciales, donde algunos parámetros
dinámicos se formularán de forma mucho más sencilla.
102 Revisión de elementos de dinámica clásica
Para ello pongamos en primerlugar G = Gn, x = ru donde n,u representan
las direcciones de los vectores G,x y G, r sus normas. Por ser n y u ortogonales
podemos definir un nuevo vector v = n ⇥ u de forma que U = {O,u,v,n}
sea un sistema de referencia ortonormal directo que llamaremos sistema orbital.
Las direcciones definidas por u,v,n serán llamadas respectivamente dirección
radial, dirección transversal y dirección normal, y el plano Oxy representa el
plano instantáneo del movimiento.
O
e
1
e
2
e
3
u
v
n
p
1
x
X
u
v
p
1
p
2
✓
Figura 6.2: Sistema de referencia orbital.
Con objeto de estudiar mejor el movimiento de una part́ıcula en su plano es
conveniente elegir un sistema de coordenadas polares, para lo cual, puesto que ya
tenemos O como origen de coordenadas, basta definir una dirección constante en
el plano, p
1
, desde donde medir el ángulo ✓ de coordenadas polares (figura 6.2).
Si llamamos p
2
= n ⇥ p
1
, podremos definir un sistema de referencia ortonormal
{O,p
1
,p
2
,n}, tal que las direcciones p
1
,p
2
son constantes, esto es, ṗ
1
= 0, ṗ
2
= 0.
Las expresiones de u,v en la base p
1
,p
2
,n serán:
u = cos ✓ p
1
+ sen ✓ p
2
,
v = � sen ✓ p
1
+ cos ✓ p
2
,
que derivadas conducen a las igualdades:
u̇ = ✓̇ v, v̇ = �✓̇u. (6.9)
Teniendo en cuenta las relaciones anteriores y la expresión del vector de posi-
ción en la base orbital x = ru, se llega fácilmente, por derivación, a las expresiones:
X = ẋ = ṙu+ r✓̇ v,
a = ẍ = (r̈ � r✓̇2)u+ (r✓̈ + 2ṙ✓̇)v,
(6.10)
que expresan la velocidad y aceleración de P en el sistema orbital y define los con-
ceptos de velocidad radial ṙ, velocidad transversal r✓̇, aśı como los de aceleración
radial (r̈ � r✓̇2) y aceleración transversal (r✓̈ + 2ṙ✓̇).
Sistemas dinámicos 103
El vector velocidad areolar se podrá expresar, en el sistema orbital, como
V
A
=
1
2
r2✓̇n. (6.11)
6.5 Sistemas dinámicos
Supondremos un sistema dinámico formado por N puntos P
i
, i = 1, . . . , N, de
masas m
i
y cuya posición viene expresada en un sistema inercial por los vectores
x
i
. Como sabemos la dinámica de este sistema de puntos viene descrita por el
conjunto de ecuaciones resultante de la aplicación de la ecuación fundamental de
Newton a cada una de las part́ıculas
F
i
=
dp
i
dt
, i = 1, . . . , N, siendo p
i
= m
i
ẋ
i
. (6.12)
En general los puntos P
i
no se mueven libremente sino que están sujetos a una
serie de condiciones, o ligaduras, que no son sino relaciones funcionales entre los
vectores de posición del tipo
f(x
1
,x
2
, . . . ,x
N
; t) = 0.
Ejemplos de ligaduras de este tipo son las relaciones entre los puntos de un sólido:
(x
i
� x
j
)2 = c2
ij
o el que una part́ıcula que se mueve en una curva o superficie,
etc.
Normalmente nos referiremos a cada part́ıcula por un vector x
i
, de tres coor-
denadas cartesianas, por lo que un sistema de N puntos viene representado por
3N coordenadas. Si el sistema tiene k ligaduras o ecuaciones de relación, podrán
introducirse n = 3N � k coordenadas independientes, q = (q
1
, . . . , q
n
), de forma
que podamos expresar las posiciones de las part́ıculas como
x
i
= x
i
(q; t), i = 1, . . . , N.
A este conjunto de coordenadas independientes les llamaremos coordenadas
generalizadas, mientras que al espacio n-dimensional de las coordenadas libres le
llamaremos espacio de configuración. Las derivadas de las coordenadas generali-
zadas q̇ = (q̇
1
, . . . , q̇
n
) son las velocidades generalizadas. Llamaremos número de
grados de libertad al número n de coordenadas libres del sistema.
Se llama enerǵıa cinética de un sistema dinámico a la función
T =
N
X
i=0
1
2
m
i
ẋ
2
i
.
Para expresar la enerǵıa cinética en función de las coordenadas generalizadas
tendremos en cuenta que x
i
= x
i
(q
1
, . . . q
n
), por tanto
ẋ
i
=
@x
i
@q
dq
dt
+
@x
@t
= �
i
(q, q̇, t),
104 Revisión de elementos de dinámica clásica
y finalmente se tendrá T = T (q, q̇, t).
Se llama enerǵıa potencial del sistema a una función escalar V cuyo gradiente
coincide con la resultante F de las fuerzas que actúan sobre una part́ıcula.
F = �rV =
✓
@V
@q
1
, . . . ,
@V
@q
n
◆
.
Cuando V existe sólo depende de q, no depende ni de q̇ ni de t. Por tanto V =
V (q).
6.6 Ecuaciones de Lagrange y de Hamilton
Llamaremos función lagrangiana de un sistema dinámico a la expresión
L(q, q̇, t) = T (q, q̇, t) + V (q). (6.13)
Las ecuaciones del movimiento de un sistema mecánico (6.12) pueden expre-
sarse en términos de la función lagrangiana en la forma
d
dt
✓
@L
@q̇
i
◆
� @L
@q
i
= 0, i = 1, . . . , n, (6.14)
o lo que es igual
d
dt
⇣
r
˙
q
L
⌘
�r
q
L = 0. (6.15)
Estas ecuaciones serán llamadas ecuaciones de Lagrange y su solución equivale a
la solución de las ecuaciones de Newton del sistema.
Definiremos los momentos (generalizados), p = (p
1
, . . . , p
n
), a partir de las
igualdades
p
i
=
@L
@q̇
i
. (6.16)
Estas funciones nos permiten expresar las velocidades generalizadas q̇
i
en la forma
q̇
i
= q̇
i
(q,p, t).
Al espacio 2n dimensional (q,p) le llamaremos espacio fásico (o espacio de las
fases).
Llamaremos función hamiltoniana, o también hamiltoniano H, a la transfor-
mada de Legendre de la función lagrangiana considerada como función de q̇, esto
es
H(q,p, t) = p · q̇(q,p, t)� L(q, q̇(q,p, t), t). (6.17)
El sistema de ecuaciones de Lagrange (6.14) es equivalente a las ecuaciones:
q̇ =
@H
@p
= r
p
H, ṗ = �@H
@q
= �r
q
H, (6.18)
Transformaciones canónicas 105
que son llamadas ecuaciones de Hamilton del sistema.
En ocasiones utilizaremos una notación más compacta en la que llamaremos
x = (q,p) 2 IRn⇥ IRn al vector de coordenadas y momentos (en este orden), de
forma que el hamiltoniano se expresará como
H(x, t) = H(q,p, t). (6.19)
La evolución dinámica del sistema viene dada por las ecuaciones de Hamilton
ẋ = Jr
x
H, (6.20)
donde J es la matriz antisimétrica
J =
✓
0
n
I
n
�I
n
0
n
◆
,
que verifica J�1 = J T = �J , y donde 0
n
, I
n
, representan, respectivamente, las
matrices nula y unidad de orden n.
6.7 Transformaciones canónicas
Sea la transformación del espacio fásico : IR2n ! IR2n : x = (q,p) ! y =
(Q,P ), definida por las expresiones y = y(x, t), que supondremos de clase C(1)
y tal que det� 6= 0 en el dominio (x, t) que se considere, siendo � la matriz
jacobiana
� = y
x
= r
x
y =
✓
@y
i
@x
j
◆
=
0
B
B
B
@
@y
1
@x
1
. . .
@y
1
@x
2n
. . . . . . . . .
@y
2n
@x
1
. . .
@y
2n
@x
2n
1
C
C
C
A
. (6.21)
Una transformación que satisface las condiciones anteriores se dice transfor-
mación canónica, si y solo si, existe una constante µ tal que se satisface la relación3
�J�T = µJ . La constante µ es llamada multiplicador de la transformación. En
particular, si µ = 1 la transformación se llama transformación completamente
canónica (t.c.c).
Propiedad.- Una transformación es canónica, si y solo si se tiene �TJ� = µJ .
Propiedad.- El conjunto de las transformaciones canónicas forma grupo con res-
pecto a la composición de transformaciones. Las transformaciones completamente
canónicas forman un subgrupo del grupo anterior.
Hay que recordar aqúı que la composición de dos transformaciones canónicas es
otra transformación canónica de multiplicador el producto de los multiplicadores.
3Una matriz A que satisfaga la condición AJA
T = J será llamada matriz simpléctica.
106 Revisión de elementos de dinámica clásica
Además, si �
1
,�
2
son las matrices jacobianas correspondientes a dos transforma-
ciones canónicas, la matriz jacobiana de la composición es el producto �
1
�
2
.
Por otro lado, la transformación identidad (cuya matriz jacobiana es I
2n
)
es una transformación canónica de multiplicador 1, pues I
2n
J IT
2n
= J . Esta
transformación representa el elemento neutro del grupo de transformaciones.
Por último, la inversa de una transformación canónica de matriz jacobiana�
y multiplicador µ, es otra transformación canónica de matriz jacobiana ��1 y
multiplicador 1/µ.
La propiedad anterior nos asegura que para cada t.c.c : y = y(x, t) existe
una transformación inversa ' : x = x(y, t). Esta transformación puede ser apli-
cada a la función F (x, t), definida en el espacio fásico, con lo que obtendremos la
función transformada '⇤F (y, t) = F (x(y, t), t).
Propiedad.- Una transformación y = y(x, t) es canónica si y solo si existe una
funciónW, y una función resto,R = R(t), tal que dW = 2Rdt�µx·J dx+y·J dy,
siendo µ constante.
Propiedad.- Una transformación y = y(x) es completamente canónica si y solo si
existe una función W tal que se verifica una cualquiera de las relaciones siguientes:
dW = q · dp+ P · dQ,
dW = q · dp�Q · dP ,
dW = p · d q +Q · dP ,
dW = p · d q � P · dQ.
(6.22)
Propiedad.- Sean S(1)(P , q, t), S(2)(p,Q, t), S(3)(p,P , t), S(4)(p, q, t) funciones
de clase C(2) tales que det(S(1)
Pq
) 6= 0, det(S(2)
pQ
) 6= 0, det(S(3)
pP
) 6= 0, det(S(4)
qQ
) 6=
0, entonces las ecuaciones:
p = r
q
S(1), Q = r
P
S(1), R(1) = S(1)
t
,
q = r
p
S(2), P = r
Q
S(2), R(2) = �S(2)
t
,
q = �r
P
S(3), Q = r
P
S(3), R(3) = S(3)
t
,
p = r
q
S(4), P = �r
Q
S(4), R(4) = S(4)
t
,
(6.23)
definen transformaciones completamente canónicas de función resto R(i). A las
funciones S(i) se les llama función generatriz (o generador) de la transformación,
y a las transformaciones generadas se les llama transformaciones de contacto.
Ecuación de Hamilton–Jacobi y ecuación de Delaunay 107
6.8 Ecuación de Hamilton–Jacobi y ecuación de
Delaunay
Propiedad.- Si existe una función S(P , q, t) generatriz, del tipo S(1), de una
transformación completamente canónica que satisface la ecuación de Hamilton–
Jacobi
H(q,r
q
S, t) + S
t
= 0, (6.24)
entonces las nuevas variables y momentos (Q,P ) son constantes (integrales) del
sistema dinámico de hamiltoniano H.
Si el hamiltoniano H es conservativo se tendrá H(q,r
q
S) = �S
t
= P
1
, donde
P
1
es una constante que suele tomarse como nuevo primer momento. De esta
forma
S = �P
1
t+W(P , q),
y la ecuación de Hamilton–Jacobi se transforma en
H(q,r
q
W) = P
1
. (6.25)
Encontrar una función W solución de la ecuación anterior equivale a encontrar
una transformación canónica que transforma el hamiltoniano en K(Q,P ) = P
1
.
Poincaré generaliza este resultado y propone buscar un generador S(P , q) que
sea solución de la ecuación en derivadas parciales
H(q,r
q
S) = K(r
P
S,P ), (6.26)
de manera que la transformación completamente canónica generada por ella trans-
forme el hamiltoniano en K(y,Y ). A dicha ecuación le llamó ecuación de Delaunay
por su similitud con la usada por éste para la teoŕıa de la Luna.
108 Revisión de elementos de dinámica clásica
Caṕıtulo 7
Movimiento kepleriano
7.1 Introducción
El movimiento de los planetas es uno de los problemas que más interés ha
suscitado a lo largo de la historia de la ciencia. La explicación de este movimiento
favoreció el desarrollo de numerosos métodos matemáticos y f́ısicos e incluso la
creación de nuevas disciplinas cient́ıficas con las que abordar el aparentemente
simple pero sutilmente complejo problema. Aunque a este tema han dedicado sus
esfuerzos muchos de los mejores cient́ıficos, tanto antes como después de Kepler
y Newton, a ellos dos se deben las bases sobre las que se sustentan, tanto la
Mecánica Celeste, como la Astrodinámica y que serán descritas a lo largo de este
caṕıtulo.
7.2 Leyes de Kepler
El paso fundamental en la explicación del movimiento de los planetas lo dio
Johannes Kepler (1571-1630), quien a partir de las excelentes observaciones lleva-
das a cabo por su maestro, el astrónomo danés Tycho Brahe (1546-1601), dedujo
las tres leyes llamadas leyes de Kepler1, que pueden enunciarse de la siguiente
manera:
1. Los planetas se mueven en órbitas planas alrededor del Sol, siendo las áreas
descritas proporcionales a los tiempos empleados en describirlas (figura 7.1).
1Las dos primeras leyes las publicó en 1609 en su obra Astronomia Nova, mientras que la
tercera fue posterior (1619) y apareció en Harmonicie Mundi. Libri V.
110 Movimiento kepleriano
2. Las órbitas descritas por los planetas son elipses, de las cuales, el Sol ocupa
un foco.
3. Los cubos de los semiejes mayores de las órbitas planetarias son proporcio-
nales a los cuadrados de los tiempos empleados en recorrerlas.
Figura 7.1: Ley de las áreas.
Lo que sigue de caṕıtulo lo de-
dicaremos a desarrollar las herra-
mientas necesarias para compren-
der las leyes de Kepler y, a partir
de ellas, desvelar el camino seguido
por Newton para enunciar la ley de
gravitación universal que es el fun-
damento de la Mecánica Celeste y
de la Astrodinámica.
7.3 Propiedades de las cónicas
La segunda ley de Kepler establece la elipse como la figura del movimiento
orbital de los planetas. Las consecuencias de la ley de Newton, que se verán
después, añaden la parábola y la hipérbola como posible movimiento orbital. Estas
tres figuras geométricas tienen en común la propiedad que las define como el lugar
geométrico de los puntos tales que la razón de sus distancias a un punto fijo, foco,
y a una recta también fija, directriz, es una constante e > 0, que llamaremos
excentricidad. Estas figuras son llamadas cónicas y sus propiedades determinan
muchas de las propiedades del movimiento orbital por lo que son analizadas en
este apartado.
P Q
D
r
✓
F (foco) eje directriz
Figura 7.2: Eje y directriz de una cónica.
De acuerdo con la anterior defi-
nición, y la figura 7.2 se tendrá
FP
PQ
= e =
r
p/e� r cos ✓
, (7.1)
donde hemos introducido el paráme-
tro p > 0, que es igual a h e, siendo
h la distancia entre el foco y la di-
rectriz. A la recta perpendicular a
la directriz que pasa por el foco se le llamará eje de la cónica.
De acuerdo con (7.1), la ecuación de la cónica en coordenadas polares, con
origen en F y cuyo eje es el de la cónica, tendrá la forma:
r =
p
1 + e cos ✓
. (7.2)
Propiedades de las cónicas 111
La constante e determina la forma de la cónica, mientras que p nos da la
escala de longitud. Al parámetro p se la suele llamar semilado recto2, pues para
✓ = ⇡/2, r = p, luego representa la mitad de la cuerda perpendicular al eje que
pasa por el foco.
Nótese que el caso e = 0, que se obtiene como caso ĺımite cuando la directriz
se encuentra a una distancia infinita, corresponde a la curva r = p, esto es, a una
circunferencia de radio p.
La ecuación (7.2) puede ser escrita como
p
r
= 1 + e cos ✓. (7.3)
Los valores ✓ = 0, ✓ = ⇡ corresponden, respectivamente, al máximo y mı́nimo de
p/r, esto es, al mı́nimo y máximo de r. Sin embargo, cuando e � 1, el valor ✓ = ⇡
carece de sentido pues por ser r una distancia, p/r debe ser estrictamente positivo.
De acuerdo con esta propiedad distinguiremos tres casos según los valores de e.
7.3.1 Elipses: 0 e < 1
Llamaremos elipse a un cónica cuya excentricidad esté entre cero y uno. En este
caso tendremos un valor mı́nimo y máximo de r en dos puntos, que llamaremos
respectivamente pericentro y apocentro. Las distancias al foco en estos puntos
vienen dadas por:
r
p
=
p
1 + e
, r
a
=
p
1� e
. (7.4)
Introduzcamos tres nuevas constantes por medio de las relaciones:
a =
p
1� e2
, c = a e =
p e
1� e2
, b = a
p
1� e2, (7.5)
y definamos un sistema de referencia plano en el que el origen O es un punto del
eje de la cónica a una distancia c del foco en la dirección opuesta a la directriz,
y el eje Ox es el eje de la cónica, mientras que el eje Oy es perpendicular a Ox.
En este sistema de referencia las coordenadas cartesianas de un punto de la elipse
vendrán dadas por
x = c + r cos ✓ = c+
p cos ✓
1 + e cos ✓
,
y = r sen ✓ =
p sen ✓
1 + e cos ✓
.
(7.6)
Puede comprobarse fácilmente que un punto P de coordenadas (x, y) dadas por
las expresiones anteriores verifica la ecuación
x2
a2
+
y2
b2
= 1. (7.7)2Semilatus rectum.
112 Movimiento kepleriano
a
b a
cF 0 F
r
p
Figura 7.3: Elipse.
Las distancias a y b son lla-
madas, respectivamente, semieje
mayor y semieje menor de la elip-
se y su significado puede verse en
la figura 7.3.
De acuerdo con la primera de
las expresiones (7.5) podemos ex-
presar las distancias (7.4) al pe-
ricentro y apocentro como:
r
p
= a (1� e),
r
a
= a (1 + e).
(7.8)
7.3.2 Parábolas: e = 1
Cuando la excentricidad vale uno, la cónica es llamada parábola. En este caso
únicamente hay pericentro, por lo que tenemos una curva abierta. La distancia
mı́nima al foco es ahora r
p
= p/2.
Si elegimos un sistema da referencia plano, con origen en el periastro y eje Ox
el de la cónica con coordenadas positivas en la dirección opuesta a la directriz, las
coordenadas cartesianas de un punto de la parábola serán
x =
p
2
� p cos ✓
1 + cos ✓
,
y =
p sen ✓
1 + cos ✓
,
(7.9)
de donde fácilmente obtenemos como ecuación de la parábola la expresión
y2 = 2px, (7.10)
cuya gráfica puede verse en la figura 7.4(a).
7.3.3 Hipérbolas: e > 1
Las cónicas con excentricidad mayor que uno, llamadas hipérbolas, únicamente
poseen pericentro por lo que, como las parábolas, son curvas abiertas.
Si introducimos las cantidades:
a =
p
e2 � 1
, c = ae, b = a
p
e2 � 1, (7.11)
y definimos un sistema de referencia plano con origen en un punto del eje de la
cónica a una distancia c del foco en la dirección de la directriz y eje Ox el de la
Ley de gravitación de Newton 113
cónica, las coordenadas cartesianas de un punto p de la hipérbola serán
x = ae � p cos ✓
1 + e cos ✓
,
y =
p sen ✓
1 + e cos ✓
.
(7.12)
La ecuación de la hipérbola será por tanto
x2
a2
� y2
b2
= 1, (7.13)
que de acuerdo con la figura 7.4(b) tiene dos ramas simétricas.
El valor de la distancia al pericentro será en este caso
r
p
= a (e� 1). (7.14)
p
2
p
2
x
y
F
(a) Parábola
O a
b c
r
p
c
(b) Hipérbola
Figura 7.4: Cónicas abiertas
7.4 Ley de gravitación de Newton
Las leyes de Kepler suponen el penúltimo eslabón en la carrera por compren-
der y explicar el movimiento de los planetas. Éstas describen con exactitud el
movimiento de los mismos pero, sin embargo, no dan una explicación f́ısica de
las causas del movimiento. El último paso lo da Isaac Newton (1642–1727) quien,
a partir de estas leyes y tras poner las bases de la Mecánica y del Cálculo Di-
ferencial, enuncia la ley de gravitación universal que ha seguido vigente hasta la
114 Movimiento kepleriano
introducción de la teoŕıa de la relatividad, pero que todav́ıa sigue dando respuesta
a la mayor parte de las cuestiones que plantea el movimiento orbital.
En lugar de limitarnos a enunciar la ley de gravitación deduciremos ésta a
partir de las leyes de Kepler. Para ello formularemos las leyes de Kepler desde
un punto de vista más matemático. De acuerdo con la segunda ley, un planeta se
mueve en una órbita eĺıptica, que expresada en coordenadas polares es
r =
a(1� e2)
1 + e cos ✓
, (7.15)
donde a y e son dos constantes que representan el semieje y la excentricidad de
la elipse, mientras que r depende de t a través del ángulo ✓.
La tercera ley de Kepler nos indica que la razón a3/P 2 es constante para todos
los planetas. Aqúı hemos llamado P al periodo orbital del planeta.
Si el movimiento es plano, el vector posición x lo podemos descomponer en
dos direcciones, la radial (u = x/r) y la transversal (v), perpendicular a la radial,
de modo que los vectores posición, velocidad y aceleración son:
x = u r,
ẋ = u ṙ + v r✓̇,
ẍ = u (r̈ � r✓̇2) + v (2ṙ✓̇ + r✓̈).
(7.16)
La velocidad areolar (área barrida por el radio vector por unidad de tiempo) es
r2✓̇/2; pues bien, la primera ley nos dice que esta expresión es una constante, que se
podrá obtener dividiendo el valor de un área barrida (que sepamos calcular) por el
tiempo invertido en describirla. En un periodo P , el área barrida será precisamente
el área de la elipse (⇡ab), aśı pues,
1
2
r2✓̇ =
⇡ a b
P
=
⇡ a2
p
1� e2
P
, (7.17)
pero esta expresión es una cantidad constante, por lo que derivando, se tiene que
d(r2✓̇)
dt
= r(2ṙ✓̇ + r✓̈) = 0,
o lo que es lo mismo, la aceleración transversal (7.16) es nula, y la aceleración
solamente tiene componente radial, luego la fuerza que produce el movimiento
debe ser radial (recordemos que la segunda ley de la Mecánica de Newton establece
que la fuerza = masa ⇥ aceleración). En consecuencia, la fuerza que ejerce el Sol
sobre un planeta de masa m será
F = m(r̈ � r✓̇2)
x
r
.
Derivando la ecuación de la elipse (7.15) y teniendo en cuenta la expresión (7.17)
de la velocidad areolar obtenida a partir de la tercera ley de Kepler, llegamos a
F = �m 4⇡2a3
P 2r3
x = �m��
r3
x,
Problema de dos cuerpos 115
donde hemos llamado �� a la constante derivada de la tercera ley de Kepler.
Finalmente, por el principio de acción y reacción de Newton, la fuerza ejercida
por el Sol sobre el planeta debe ser igual en norma, pero de sentido contrario, a
la que ejerce el planeta sobre el Sol, luego de modo análogo se tendrá
m�� = m��,
siendo m� la masa del Sol y � la constante para la órbita del Sol respecto del
planeta. De acuerdo con esa igualdad, podremos poner
m�
��
=
m
�
= G,
donde hemos introducido una nueva constante G que llamaremos constante de
gravitación universal. Esto conduce finalmente a la expresión final de la fuerza de
atracción que el Sol ejerce sobre el planeta
F = �Gmm�
r2
x
r
, (7.18)
que nos permite enunciar la Ley de Newton, que dice: la fuerza que ejerce el Sol
sobre un planeta es atractiva, lleva la dirección de ambos cuerpos y es proporcional
al producto de las masas de éstos, e inversamente proporcional al cuadrado de su
distancia mutua.
7.5 Problema de dos cuerpos
La ley de Newton, que ha sido enunciada en el apartado anterior para dos
planetas, puede extenderse a dos masas puntuales cualesquiera siendo la base del
problema fundamental de la Astrodinámica o Mecánica Celeste, que será llama-
do problema de dos cuerpos, y que consiste en el estudio del movimiento de dos
masas puntuales P
1
, P
2
, de masas respectivas m
1
,m
2
, que interaccionan gravita-
cionalmente bajo la ley de atracción universal enunciada por Newton.
O
x
r
1
r
2
P
1
P
2
Figura 7.5: Problema de dos cuerpos.
Para formular este problema llamare-
mos r
1
, r
2
respectivamente, a los vecto-
res de posición OP
1
, OP
2
, y x al vector
de posición relativa P
1
P
2
y supondremos
que están referidos a un sistema de referen-
cia ortogonal, directo e inercial. En virtud
de la segunda ley de la mecánica de New-
ton (fuerza = masa⇥ aceleración), se tiene
que:
m
1
r̈
1
= Gm
1
m
2
r2
x
r
,
m
2
r̈
2
= � Gm
1
m
2
r2
x
r
,
(7.19)
116 Movimiento kepleriano
donde r = kx k es la distancia mutua entre P
1
y P
2
, y G la constante de gravitación
universal.
El sistema (7.19) constituye un sistema diferencial de orden doce, por lo que
la integración del problema quedará resuelta si encontramos doce integrales inde-
pendientes del mismo.
El problema queda fácilmente reducido a otro de orden seis si tenemos en
cuenta que sumando las ecuaciones (7.19) se tiene
m
1
r̈
1
+m
2
r̈
2
= 0,
de donde, de manera inmediata obtenemos
m
1
r
1
+m
2
r
2
= m r
c
= At+B, (7.20)
donde r
c
representa la posición del centro de masas del sistema y m = m
1
+m
2
.
Los vectores constantesA,B constituyen las seis primeras integrales del problema.
La expresión (7.20), también llamada integral del centro de masas, nos indica que
el centro de masas de un sistema formado por dos cuerpos que se atraen según la
ley de gravitación de Newton, se mueve con un movimiento rectiĺıneo y uniforme.
7.6 Movimiento relativo o kepleriano
Las integrales del centro de masas pueden aprovecharse para formular las ecua-
ciones (7.19) de manera más simple. Para ello, tengamos en cuenta las relaciones
m r
c
= m
2
r
2
+ m
1
r
1
,
x = r2
� r
1
,
(7.21)
que pueden invertirse en la forma:
r
1
= r
c
� m
2
m
x,
r
2
= r
c
+
m
1
m
x.
(7.22)
Las anteriores relaciones indican que una vez conocida la evolución temporal
del vector del centro de masas r
c
y la del vector de posición relativa x conoceremos
también la de r
1
y r
2
, por lo que el problema queda resuelto. Las seis integrales
(7.20) determinan el movimiento de r
c
, por lo que basta encontrar el movimiento
relativo de P
2
respecto a P
1
para que el problema quede completamente resuelto.
En efecto, derivando dos veces la segunda de las ecuaciones (7.21) con respecto al
tiempo y sustituyendo el valor de las segundas derivadas dado en (7.19), llegamos
a las ecuaciones del movimiento relativo que pueden ponerse como:
ẍ = � µ
r3
x, (7.23)
Movimiento relativo o kepleriano 117
donde r = kx k y µ = Gm = G(m
1
+m
2
), siendo m la suma de las masas de P
1
y P
2
.
La ecuación (7.23) rige el movimiento relativo de P
2
en torno a P
1
y es, en
realidad, la ecuación que gobierna toda la Astrodinámica, pues cuando nos refe-
rimos al movimiento orbital, estamos siempre hablando del movimiento relativo,
bien en torno al Sol, como en el caso de los planetas, bien en torno a la Tierra, en el
caso de los satélites artificiales. Al modelo planteado por el sistema de ecuaciones
diferenciales (7.23) le llamaremos problema kepleriano y al movimiento derivado
de la solución de dichas ecuaciones le llamaremosmovimiento kepleriano. Además,
en este caso diremos que P
2
está en órbita kepleriana alrededor de P
1
.
x
P
1
P
2
Figura 7.6: Movimiento relativo de P2 en
torno a P1.
Aunque el problema de dos cuer-
pos ha sido formulado en un sistema
de referencia inercial, el problema ke-
pleriano se formula en un sistema con
centro en P
1
y ejes paralelos a los del
sistema inercial (figura 7.6). Este sis-
tema no rota, pero su origen se mue-
ve con el movimiento de P
1
que no
será en general rectiĺıneo y uniforme
sino que posee una aceleración y por
tanto no será inercial. Esto no es pro-
blema pues las ecuaciones (7.23) no
son una aplicación directa de la ley
fundamental de Newton, que debe ser
formulada obligatoriamente en un sis-
tema inercial, sino que se trata de un modelo matemático obtenido por reducción
del problema de dos cuerpos aplicando la integral del centro de masas.
La aplicación práctica de las ecuaciones (7.23) al movimiento de un satélite
artificial se formula en un sistema con centro en el centro de masas de la Tierra
y ejes fijos, un sistemas de este tipo es llamado sistema inercial con centro en la
Tierra, ECI, que aunque no es inercial cumple la misma función que uno inercial
para este problema. Los sistemas S
G
(GCRS) y E
�o
constituyen los dos ejemplos
de sistemas de este tipo que usaremos para formular el movimiento de los satélites
artificiales.
Además de la ecuación de orden dos (7.23), las ecuaciones del movimiento
kepleriano pueden ponerse como un sistema de ecuaciones de orden uno en la
forma:
ẋ = X,
Ẋ = � µ
r3
x,
(7.24)
donde X es el vector velocidad cuya norma será llamada v.
El problema kepleriano puede ser también expresado en forma hamiltoniana.
Para ello supondremos un sistema dinámico cuyo hamiltoniano, que llamaremos
118 Movimiento kepleriano
hamiltoniano kepleriano, tendrá la forma
H
k
(x,X) =
1
2
X ·X � µ
r
, (7.25)
donde x son las coordenadas y X los momentos y hemos llamado enerǵıa cinética
del movimiento relativo al primer sumando y enerǵıa potencial del movimiento
relativo al segundo.
Las ecuaciones de Hamilton aplicadas al hamiltoniano H
k
son:
ẋ = r
X
H
k
= X,
Ẋ = �r
x
H
k
= � µ
r3
x,
(7.26)
y por tanto son idénticas a las ecuaciones (7.24) del movimiento kepleriano, por
ello, podemos concluir que éste está representado por un sistema dinámico de
hamiltoniano H
k
.
7.7 Solución expĺıcita del problema kepleriano:
funciones f y g de Lagrange
La teoŕıa de ecuaciones diferenciales ordinarias nos asegura que las ecuaciones
(7.24) tienen una única solución para un conjunto de condiciones iniciales dado
por el vector de posición y velocidad x
0
,X
0
en un instante t
0
. Si encontramos
la expresión de la posición y velocidad para un instante dado t en términos de
las condiciones iniciales x = x(t,x
0
,X
0
), X = X(t,x
0
,X
0
) podemos dar el
problema por integrado.
Para encontrar la solución anterior excluiremos el caso en que x
o
y X
0
sean
colineales, que como veremos en el caṕıtulo siguiente corresponde a una solución
particular del problema: las órbitas rectiĺıneas. Sabiendo de antemano que las so-
luciones del problema estarán en un plano fijo y que x
o
y X
0
son dos vectores
linealmente independientes en dicho plano y, por tanto, forman una base del mis-
mo, entonces existirán dos escalares f, g, dependientes del instante t y del instante
t
0
, tales que se verifica
x = f(t; t
0
)x
0
+ g(t; t
0
)X
0
. (7.27)
Derivando esta expresión se tendrá también que
X =
@f(t; t
0
)
@t
x
0
+
@g(t; t
0
)
@t
X
0
. (7.28)
Las funciones f y g de Lagrange, también llamadas coeficientes de transición,
no constituyen una forma eficiente de calcular las posiciones y velocidades de un
cuerpo en órbita pues, como veremos ahora, sus expresiones expĺıcitas en función
Funciones f y g de Lagrange 119
del tiempo no pueden ser expresadas en forma cerrada, esto es, sin recurrir a desa-
rrollos en series de potencias del tiempo. Dichos desarrollos deben ser truncados
y por tanto no producen una buena aproximación a la solución. Además dichos
desarrollos son válidos únicamente en un entorno pequeño de t
0
.
A pesar de lo dicho estudiaremos aqúı estas funciones pues su significado es
muy útil para comprender algunas propiedades de este tipo de movimiento y
además son la base de algunos métodos de determinación de órbitas a partir de
datos de observación, aunque éstos no serán tratados en este libro. Para ello,
veremos a continuación algunas propiedades de dichas funciones.
Propiedad.- Las funciones f(t; t
0
), g(t; t
0
) son soluciones de la ecuación diferen-
cial
�̈+
µ
r(t)
� = 0, (7.29)
de forma que f es la solución particular de (7.29) determinada uńıvocamente por
las condiciones iniciales:
f(t
0
, t
0
) = 1,
@f(t
0
; t
0
)
@t
= 0, (7.30)
mientras que g es la solución particular de (7.29) determinada uńıvocamente por
las condiciones iniciales:
g(t
0
, t
0
) = 0,
@g(t
0
; t
0
)
@t
= 1. (7.31)
Para demostrar ésto basta tener en cuenta la ecuación fundamental del movi-
miento orbital
Ẋ = � µ
r3
x,
donde sustituyendo las igualdades (7.27) y (7.28) obtenemos
@2f(t; t
0
)
@t2
+
µ
r3
f(t; t
0
)
�
x
0
+
@2g(t; t
0
)
@t2
+
µ
r3
g(t; t
0
)
�
X
0
= 0.
La independencia lineal de x
0
y X
0
nos asegura que se verificará:
@2f(t; t
0
)
@t2
+
µ
r3
f(t; t
0
) = 0,
@2g(t; t
0
)
@t2
+
µ
r3
g(t; t
0
) = 0,
por lo que f y g verifican (7.29).
Se completa la demostración observando que las condiciones iniciales de f y g
se corresponden con las obtenidas particularizando en t = t
0
las igualdades (7.27)
y (7.28).
120 Movimiento kepleriano
Para obtener una expresión expĺıcita de las funciones f y g en función de t
desarrollaremos estas funciones en serie de potencias de t. Para la obtención de
dichas series usaremos un procedimiento recursivo que se adapta muy bien a su
implementación en un ordenador mediante programas de manipulación algebraica
y simbólica.
La ecuación (7.29) puede ponerse como
�̈ = �R�,
donde hemos llamado
R =
µ
r3
. (7.32)
La función R es asimismo solución de la ecuación diferencial
Ṙ = �3RS,
que se obtiene sin más que derivar (7.32) y llamar S a la función
S =
ṙ
r
, (7.33)
que derivada conduce a la expresión
Ṡ =
rr̈ � ṙ2
r2
.
Por otro lado, considerando las constantes3 h = v2/2 � µ/r y G = r2✓̇, y la
relación v2 = ṙ2 + r2✓̇2, llegamos a las expresiones
ṙ2 = v2 � G2r2
, v2 = 2h+
2µ
r
,
que derivadas permiten poner
r̈
r
=
G2
r4
� µ
r3
,
y finalmente
Ṡ =
G2
r4
�R� S2 =
v2 � ṙ2
r2
�R� S =
v2
r2
�R� 2S,
expresión que puede ponerse como
Ṡ = W �R� 2S,
donde hemos llamado
W =
v2
r2
=
X
2
r2
. (7.34)
3El significado de estas expresiones y la demostración de que son constantes aparecerá en el
apartado 8.2 del próximo caṕıtulo.
Funciones f y g de Lagrange 121
Por último, derivando W se tiene
Ẇ =
2(X · Ẋ)r2 � v2rṙ
r4
= �2 µ
r3
x ·X
r2
� 2
v2ṙ
r3
= �2 µ
r3
ṙ
r
� 2
v2ṙ
r3
= �2S(R+W ).
El cálculo de las funciones f y g está basado en la resolución del sistema de
ecuaciones diferenciales:
�̈ = �R�,
Ṙ = �3RS,
Ṡ = W �R� 2S,
Ẇ = �2S(R+W ),
(7.35)
cuya solución será expresada por medio de series de potencias en la forma:
f =
X
i�0
f
i
(t� t
0
)i,
g =
X
i�0
g
i
(t� t
0
)i,
R =
X
i�0
R
i
(t� t
0
)i,
S =
X
i�0
S
i
(t� t
0
)i,
W =
X
i�0
W
i
(t� t
0
)i,
(7.36)
con las condiciones iniciales siguientes:
f
0
= 1 , f
1
= 0,
g
0
= 0 , g
1
= 1,
R
0
=
µ
r3
0
,
S
0
=
x
0
·X
0
r2
0
,
W
0
=
X
2
0
r2
0
,
(7.37)
Sustituyendo (7.36) en (7.35), e igualando término a término se llega a las
122 Movimiento kepleriano
relaciones:
(n+ 1)(n+ 2)f
n+2
= �
n
X
i=0
R
i
f
n�i
,
(n+ 1)(n+ 2)g
n+2
= �
n
X
i=0
R
i
g
n�i
,
(n+ 1)R
n+1
= �3
n
X
i=0
R
i
S
n�i
,
(n+ 1)S
n+1
= W
n
�R
n
� 2
n
X
i=0
S
i
S
n�i
,
(n+ 1)W
n+1
= �2
n
X
i=0
S
i
(R
n�i
+W
n�i
),
(7.38)
donde se ha tenido en cuenta la propiedad
(
X
m�0
a
m
xm)(
X
n�0
b
n
xn) =
X
j�0
(
X
0ij
a
i
b
j�i
)xj .
Si en (7.38) hacemos n = 0 obtendremos
2f
2
= �R
0
f
0
= �R
0
, 2g
2
= �R
0
g
0
= 0,
y por tanto
f
2
= �R
0
2
, g
2
= 0.
Además se tendrá:
R
1
= �3R
0
S
0
,
S
1
= W
0
�R
0
� 2S2
0
,
W
1
= �2S
0
(R
0
+W
0
),
lo que permitirá pasar a n = 1 y obtener
6f
3
= �R
0
f
1
�R
1
f
0
, 6g
3
= �R
0
g
1
�R
1
g
0
,
de donde
f
3
= �R
0
S
0
2
, g
3
= �R
0
6
.
De esta forma, por iteración podemos obtener cualquier f
n
, g
n
en función de
f
0
, f
1
, g
0
, g
1
, R
0
, S
0
,W
0
. Hasta orden tres se tendrá:
f(t; t
0
) = 1� 1
2
R
0
(t� t
0
)2 +
1
2
R
0
S
0
(t� t
0
)3 + . . .
g(t; t
0
) = (t� t
0
)� 1
6
R
0
(t� t
0
)3 + . . .
(7.39)
Caṕıtulo 8
Integración del problema
kepleriano
8.1 Modelo orbital kepleriano
O
P
x
X
Figura 8.1: Movimiento kepleriano.
Llamaremos problema kepleriano
al estudio del movimiento de una ma-
sa puntual P , que llamaremos orbita-
dor1, relativo a un cuerpo central2 O
(figura 8.1) regido por el sistema de
ecuaciones diferenciales
ẋ = X, Ẋ = � µ
r3
x, (8.1)
donde x y X son los vectores de po-
sición y velocidad de P expresados en
un sistema de referencia inercial cen-
trado en O, que llamaremos sistema
espacial, r = kx k es la distancia de
P a O y v = kX k es la norma del vector velocidad.
En el caṕıtulo anterior hemos introducido el parámetro µ = Gm, siendo m la
suma de las masas de P y O. Mientras que G se considera una constante universal,
no lo será µ, pues depende de las masas de los dos cuerpos. Sin embargo, puesto
1Satélite, sonda, planeta, cometa, asteroide, etc.
2Sol, planeta, etc.
124 Integración del problema kepleriano
que, fijado el problema, los dos cuerpos siempre serán los mismos y la masa
será constante, de aqúı en adelante utilizaremos el parámetro µ, en lugar de G, para
caracterizar el tipo de órbita. Este parámetro adquiere particular importancia en
el caso de órbitas de estrellas dobles donde, en general, las masas son desconocidas,
y por lo tanto µ también lo es.
En este caṕıtulo describiremos el comportamiento del modelo orbital keple-
riano, tanto desde el punto de vista geométrico como astronómico y astrodinámi-
co. Dicha descripción debe reproducir y explicar las tres leyes de Kepler, pues este
modelo proviene de dichas leyes. Para ello, buscaremos integrales (constantes) del
problema con un significado cinemático y dinámico preciso.
8.2 Primeras integrales
Llamaremos momento angular3 de P al vector
G = x⇥X. (8.2)
Denotaremos con G a la norma del vector G y n a su dirección, de forma que
G = Gn.
Propiedad.- El momento angular G, de una part́ıcula que se mueve en un campo
de atracción newtoniano de acuerdo con la ecuación (8.1), es constante.
En efecto, derivando G tendremos
Ġ = ẋ⇥X + x⇥ Ẋ = X ⇥X � µ
r3
(x⇥ x) = 0,
lo que demuestra la propiedad.
El vector
A = X ⇥G� µ
r
x, (8.3)
será llamado vector de Laplace4.
Llamaremos A a la norma del vector de Laplace y a a su dirección, de forma
que A = Aa.
Propiedad.- El vector de Laplace A, de una part́ıcula que se mueve en un campo
de atracción newtoniano de acuerdo con la ecuación (8.1), es constante.
Para demostrarlo tengamos en cuenta, en primer lugar, que
d(r�1
x)
dt
= r�1
X � r�2ṙx = r�3(r2X � rṙx),
3Esta definición no coincide con el concepto mecánico del momento angular de una part́ıcula,
pues no está multiplicado por la masa, sino que es un parámetro, sin significado f́ısico, definido
en el problema kepleriano para simplificar su integración. Lo mismo ocurrirá con la enerǵıa h
que se definirá más tarde.
4Llamado a veces Laplace-Runge-Lenz.
Primeras integrales 125
donde r2 = x · x, y por tanto r ṙ = x · X. Esto, junto con la propiedad (1.20),
permite poner:
d(r�1
x)
dt
=
1
r3
G⇥ x. (8.4)
Derivando A tendremos
Ȧ = Ẋ ⇥G� µ
d(r�1
x)
dt
= � µ
r3
x⇥G� µ
r3
G⇥ x = 0,
lo que demuestra la propiedad.
Las tres componentes del vector G y las tres de A constituyen seis integrales
del sistema diferencial de orden seis5 (8.1). Si estas integrales fuesen indepen-
dientes el problema estaŕıa totalmente integrado, sin embargo, no lo son, como se
demuestra en la siguiente propiedad.
Propiedad.- Los vectores G y A no constituyen seis integrales independientes
del sistema diferencial.
En efecto, si G = 0, entonces A = �µr�1
x, de donde A ·A = µ2r�2
x
2 = µ2,
por lo tanto, las tres componentes de A poseen una relación de dependencia por
ser su norma constante.
Si G 6= 0 basta tener en cuenta que G ·A = 0, lo que determina una depen-
dencia entre las seis integrales.
Otra importante constante, que constituirá una nueva integral aunque no in-
dependiente de las anteriores como veremos más adelante, es la constante definida
por medio de la expresión
h =
1
2
v2 � µ
r
, (8.5)
que será llamada enerǵıa orbital. En la definición (8.5) llamaremos enerǵıa cinética
T al término v2/2 y enerǵıa potencial V a �µ/r. Realmente dichas expresiones
no constituyen la enerǵıa cinética y potencial del problema de dos cuerpos, sino
las de un modelo teórico que se comporte igual que el problema del movimiento
relativo. Ésta es la razón por la que el valor constante de h no se deduce del
teorema de conservación de la enerǵıa, sino que debe ser demostrado.
En efecto
ḣ = X · Ẋ +
µ
r3
(x ·X) = X · (Ẋ +
µ
r3
x) = 0.
La relación entre A,G y h puede verse en la siguiente propiedad.
Propiedad.- Para una part́ıcula sometida a un campo de atracción newtoniano,
las constantes A,G y h verifican la relación
A2 = 2hG2 + µ2. (8.6)
5Seis ecuaciones de orden uno.
126 Integración del problema kepleriano
En efecto, teniendo en cuenta la definición de A y la relación dada en (1.19),
se deduce que
A2 = A ·A =
✓
v2 � 2µ
r
◆
G2 + µ2,
lo que demuestra (8.6).
8.3 Deducción de la primera y segunda leyes de
Kepler
A falta de la última integral, que deduciremos en el apartado (8.5), el problema
ha quedado cerrado desde el punto de vista mecánico. Sin embargo, esto no es
aśı si atendemos a su aspecto astrodinámico o de interpretación de los resultados.
La ley de atracción de Newton se obtiene como consecuencia de las leyes de
Kepler del movimiento de los planetas. Por ello, para completar el problema de-
bemos obtener aquéllas a partir de las integrales obtenidas aqúı. Este proceso nos
llevará a la obtención de lasleyes de Kepler, aśı como también a otras consecuen-
cias interesantes del movimiento kepleriano.
Atenderemos, en primer lugar, al valor del momento angular G que puede ser
cero o distinto de cero.
Propiedad.- El momento angular G = 0 si y solo si el movimiento tiene lugar
en una ĺınea recta que pasa por el centro de atracción.
Si tenemos en cuenta la ecuación (8.4) observamos que
du
dt
=
d(r�1
x)
dt
= 0 lo
que representa que el vector unitario en la dirección del orbitador P (radial) es
una constante, o lo que es igual, que P se mueve en ĺınea recta.
Por otro lado, si la trayectoria es rectiĺınea, u = (r�1
x) es un vector constante,
luego su derivada es cero, por tantoG⇥x es cero en cualquier instante. Puesto que
x no puede ser idéntico al vector nulo en todo instante, necesariamente G debe ser
paralelo a x, además G es perpendicular a x por definición, luego necesariamente
G = 0.
Propiedad.- El momento angular G 6= 0 si y solo si el movimiento no es rectiĺıneo
y tiene lugar en un plano fijo en el espacio, perpendicular a G y que pasa por el
centro de atracción.
Efectivamente, siG 6= 0, entoncesG·x = 0 para cualquier x, luego la part́ıcula
siempre está en un plano perpendicular a G y que pasa por O. Por otro lado, si el
movimiento tiene lugar en un plano y no es rectiĺıneo x y X pertenecen a dicho
plano y no son paralelos, luego G 6= 0.
Esta última proposición demuestra que el movimiento es plano. Además, pode-
mos observar que el vector G, de norma constante, representa el doble del vector
Deducción de la primera y segunda leyes de Kepler 127
velocidad areolar, por lo que también verifica la ley de las áreas. Aśı pues, queda
comprobada la primera ley de Kepler y parte de la segunda (movimiento plano).
Veamos ahora las propiedades que se derivan del vector de Laplace.
Propiedad.- El vector de Laplace verifica las siguientes identidades:
A · x = G2 � µr, A ·X = �µṙ,
A⇥ x = rṙG, A⇥X =
⇣
v2 � µ
r
⌘
G,
(8.7)
cuya demostración es inmediata a partir de la definición del vector A.
En el caso de movimiento rectiĺıneo G = 0 y por lo tanto A = �µu =
�µ(r�1
x), luego el vector de Laplace lleva la dirección del movimiento y además
su norma es igual a µ.
Por otro lado, siG 6= 0, la relaciónA·G = 0 indica que el vectorA está siempre
en el plano del movimiento. Tendremos dos casos según el valor de A.
Propiedad.- Para cualquier valor de G 6= 0 el movimiento de la part́ıcula tiene
lugar en una cónica de excentricidad A/µ.
En efecto, si A = 0, de acuerdo con la segunda relación en (8.7), ṙ = 0, luego
r es constante, esto es, la órbita es circular. Además, de acuerdo con la primera
de las expresiones (8.7), G2 � µ r = 0, luego el radio será igual a G2/µ.
O
P
f
A
x
Figura 8.2: Anomaĺıa verdadera f .
Si A 6= 0, llamaremos anomaĺıa verdade-
ra f6 al ángulo entre el vector A y el vector
de posición x, que vendrá dado por la expre-
sión
A · x = Ar cos f.
Combinando esta igualdad con la primera de
las expresiones (8.7) podemos poner
r =
p
1 + e cos f
, (8.8)
donde hemos llamado:
p =
G2
µ
, e =
A
µ
. (8.9)
La ecuación (8.8) representa una cónica de semilado recto p y excentricidad e,
donde la anomaĺıa verdadera corresponde al ángulo polar medido desde el eje
definido por el vector de Laplace.
A la dirección deA que, como vemos, juega un importante papel en la dinámica
del problema de los dos cuerpos le llamaremos ĺınea de los ápsides y representa el
6No confundir con el coeficiente de transición que se denotará siempre en la forma f(t, t0).
128 Integración del problema kepleriano
eje de la cónica y por lo tanto la dirección donde se alcanza la mı́nima distancia, y
la máxima si existe, entre el orbitador y el cuerpo central. A la posición de mı́nima
distancia le llamaremos periastro, perigeo o perihelio si el foco es, respectivamente,
un astro cualquiera, la Tierra o el Sol. Al punto de máxima distancia le llamaremos
apoastro o bien apogeo o afelio.
La última proposición demuestra la primera ley de Kepler del movimiento.
Kepler habla de elipses puesto que sus leyes describen únicamente movimientos
de planetas para los cuales no aparece ningún otro tipo de órbitas, sin embargo,
la ley permite órbitas no cerradas (parábolas o hipérbolas).
Nótese que si G = 0 la relación (8.6) coincide con la obtenida previamente,
A = µ2, mientras que para G 6= 0 se tendrá
h =
A2 � µ2
2G2
, (8.10)
que describe la enerǵıa como una función cuadrática de A. De acuerdo con esta
relación podemos caracterizar el tipo de movimiento en función de la enerǵıa. En
efecto, fijado G, h tiene un mı́nimo igual a �µ2/2G2 que se alcanza para órbitas
circulares, esto es, para A = 0. Si la órbita es eĺıptica se tiene 0 < A < µ y por
tanto h < 0. Para una órbita parabólica A = µ, luego h = 0. Por último, una
órbita hiperbólica tiene h > 0 por ser A > µ.
Por otro lado, teniendo en cuenta que para el movimiento eĺıptico se tiene
a =
p
1� e2
=
G2/µ
1�A2/µ2
=
µG2
µ2 �A2
= � µ
2h
,
y para el hiperbólico
a =
p
e2 � 1
=
G2/µ
A2/µ2 � 1
=
µG2
A2 � µ2
=
µ
2h
,
encontramos la relación entre la enerǵıa y el semieje de la órbita.
La definición de h, (8.5), combinada con su expresión en función del semieje
de la órbita y de su excentricidad permite encontrar una expresión, muy útil, de
la velocidad
v2 = µ
✓
2
r
� 1� e2
p
◆
, (8.11)
que particularizada para cada tipo de órbita puede verse, junto con otros paráme-
tros, en la tabla (8.1).
Tercera ley de Kepler: unidades 129
lineal circular eĺıptica parabólica hiperbólica
G = 0 G > 0 G > 0 G > 0 G > 0
A = 0 0 < A < µ A = µ A > µ
p = 0 p = a > 0 p = a(1� e2) > 0 p > 0 p = a(e2 � 1) > 0
e = 1 e = 0 0 < e < 1 e = 1 e > 1
h =
�µ2
2G2
< 0 h =
�µ
2a
< 0 h = 0 h =
µ
2a
> 0
v2 =
µ
a
v2 = µ
✓
2
r
� 1
a
◆
v2 =
2µ
r
v2 = µ
✓
2
r
+
1
a
◆
Tabla 8.1: Parámetros del movimiento kepleriano.
8.4 Tercera ley de Kepler: unidades
Por último comprobaremos la tercera ley de Kepler. Para ello, tendremos de
nuevo en cuenta la relación p = G2/µ.
Por un lado recordemos que G es la norma del momento angular y, como
se vio en el apartado 6.2, el doble de la velocidad areolar, lo que indica que
G representa el doble del área barrida por unidad de tiempo. Si consideramos
únicamente órbitas eĺıpticas, que son las únicas para las que se puede aplicar esta
ley, llamamos P al tiempo total invertido en recorrer toda la órbita o periodo de
la órbita, y tenemos en cuenta que el área de una elipse es ⇡ab, tendremos
G =
2⇡ab
P
.
Por otro lado, puesto que para una elipse p = b2/a y además µ = Gm se tendrá fi-
nalmente la relación
Gm = µ = 4⇡2
a3
P 2
, (8.12)
que constituye lo que, de aqúı en adelante, denominaremos tercera ley de Kepler
y que es válida solamente para el movimiento eĺıptico.
La tercera ley, tal como la enunció Kepler, dećıa que la razón del cubo de los
semiejes y los cuadrados de los periodos de las órbitas de los planetas era una
constante. Si tenemos un planeta de masa m
1
y periodo P
1
y otro de masa m
2
y
periodo P
2
, y el Sol tiene masa m
s
se tendrán las relaciones:
G(m
s
+m
1
) = 4⇡2
a3
1
P 2
1
, G(m
s
+m
2
) = 4⇡2
a3
2
P 2
2
,
130 Integración del problema kepleriano
que divididas nos darán
a3
1
P 2
1
:
a3
2
P 2
2
=
m
s
+m
1
m
s
+m
2
=
1 +m
1
/m
s
1 +m
2
/m
s
= � ⇡ 1,
lo que nos lleva a la conclusión de que la tercera ley, tal como fue enunciada
por Kepler, es falsa. Sin embargo, si tenemos en cuenta el pequeño valor de la
masa de los planetas en relación con la del Sol, podemos aproximar m
i
/m
s
por
cero, y por tanto � puede considerarse como la unidad, lo que indica que para el
grado de precisión de las observaciones de la época de Kepler la tercera ley pod́ıa
considerarse como válida tal como él la enunció.
La expresión (8.12) permite además analizar más a fondo el valor de la cons-
tante G. De hecho, G es una constante universal, perono es adimensional, esto
es, su valor numérico depende de las unidades de distancia, tiempo y masa con
las que estemos trabajando. La ecuación dimensional se deduce de la expresión
(8.12) y se puede poner como
[G] = L3T�2M�1,
lo que permite su cálculo en cualquier sistema de unidades a partir de su valor
fundamental establecido por la IAU que es igual a G = 6.672⇥ 10�11 m3s�2kg.
En la práctica usaremos la constante µ = Gm en lugar de G pues, de este modo,
se elimina la masa de la ecuación dimensional y su valor depende únicamente de
las unidades de longitud y tiempo elegidas. Sin embargo, hay que considerar que
µ ya no será una constante universal sino que depende del tipo de órbita y de
las unidades de longitud y tiempo y, por tanto, no es igual para la órbita de un
satélite artificial en torno a la Tierra7
µ� = Gm� = 0.00553033 r3� min�2,
que para la órbita de un planeta8
µ� = Gm� = 0.000295939U.A.3 dias�2.
Es muy importante notar que una vez elegido µ, en un conjunto de unidades, el
resto de variables dinámicas del problema deben ser representadas en esas mismas
unidades.
8.5 Ley horaria del movimiento
Las cinco integrales independientes obtenidas hasta aqúı nos dan únicamente
una visión geométrica global de la órbita, pues determinan la curva, o trayecto-
ria, que recorre el orbitador, pero no determinan la posición del mismo en cada
7Las unidades más adecuadas para órbitas terrestres son el radio ecuatorial r� y el minuto.
8Las unidades más adecuadas para órbitas alrededor del Sol son la unidad astronómica (U.A.)
que representa la distancia media de la Tierra al Sol y el d́ıa medio. A veces se puede usar el
año.
Ley horaria del movimiento 131
instante de tiempo. Para obtener esta posición será preciso determinar el valor de
la distancia r en función del tiempo t o bien, de forma alternativa, el valor de la
anomaĺıa verdadera f en función de t. Para ello será necesario encontrar e integrar
la relación diferencial de r o f con t obtenida a partir de la ley de las áreas que
es, dentro de las leyes de Kepler, la que establece la dinámica de la part́ıcula.
Las fórmulas (6.10) permiten expresar los vectores de posición y velocidad en
el plano orbital: x = ru, X = ṙu + rḟv. Donde hemos tomado como eje Ox la
dirección del vector de Laplace y por tanto el ángulo polar ✓ es ahora la anomaĺıa
verdadera f .
De esta forma, si consideramos únicamente órbitas no colineales (G 6= 0),
podremos poner
G = x⇥X = r2ḟn,
luego
r2ḟ = G =
p
µ p . (8.13)
Teniendo en cuenta el valor de la constante G, esta relación, llamada ley de las
áreas, nos dará la clave para la descripción de la evolución temporal del movi-
miento.
La posición de la part́ıcula en cada instante viene dada por sus coordenadas
polares r y f , luego conocida la variación de éstas con el tiempo, conoceremos la
última integral y quedará resuelto el problema que nos ocupa.
A partir de la relación r = p/(1+ e cos f), dada en (8.8), puede obtenerse por
simple derivación
ṙ =
pe sen fḟ
(1 + e cos f)2
=
e
p
r2ḟ sen f,
y teniendo en cuenta (8.13) podemos poner
ṙ =
Ge
p
sen f, (8.14)
que nos dará la variación horaria de r con respecto al tiempo en función de la
anomaĺıa verdadera f .
Además, si podemos integrar (8.13), obtendremos la variación de f con el
tiempo y por tanto la ley horaria del movimiento.
8.5.1 Formulación regularizada del movimiento kepleriano
Para realizar esta integración de una manera más sencilla introduciremos un
cambio de escala de tiempo, o cambio de variable, que regulariza la ecuación dife-
rencial en r, esto es, la convierte en un sistema lineal de orden dos con coeficientes
constantes. Para ello definiremos un nuevo tiempo s por medio de la ecuación de
Sundman:
r d s = d t. (8.15)
132 Integración del problema kepleriano
Si tomamos como origen del nuevo tiempo el instante T de paso por el periastro,
y elegimos s de forma que valga cero en el instante T , se tendrá la relación
s(t) =
Z
t
T
d ⌧
r(⌧)
, s(T ) = 0. (8.16)
El instante T corresponde al valor de f = 0, por lo que podremos poner
r(T ) = r
p
=
p
1 + e
, ṙ(T ) = 0. (8.17)
Si denotamos con un punto la derivada respecto a t y con tilde la derivada
respecto a s podremos poner:
ds
dt
= ṡ =
1
r(t)
,
dt
ds
= t0 = r(s).
(8.18)
De acuerdo con la primera de las expresiones (8.18) podemos decir que s es
estrictamente creciente con t. Por otro lado, integrando la segunda podremos
poner
(t� T ) =
Z
s
0
r(s)d s. (8.19)
En otras palabras, (8.16) tiene una única inversa dada por (8.19).
La regla de la cadena permite calcular fácilmente la derivada respecto a s de
un elemento cualquiera �, que podrá ponerse como
�0 = �̇ t0 = r �̇,
lo que permite expresar las ecuaciones del movimiento relativo (7.24) en la forma
x
0 = rX, X
0 = � µ
r2
x. (8.20)
Por otro lado, si recordamos la relación r ṙ = x ·X, podremos poner
r0 = r ṙ = x ·X,
lo que nos permite decir, por un lado, que r0(s = 0) = 0, y por otro, derivando de
nuevo
r00 = x
0 ·X + x ·X 0 = rX ·X � µ
r2
x · x = rv2 � µ.
Por último, sustituyendo el valor de v2 por el que se deduce de (8.5) se llega
fácilmente a la ecuación
r00 � 2h r = µ, (8.21)
que es una ecuación lineal de segundo orden de coeficientes constantes que nos
servirá para encontrar la posición de la part́ıcula en cualquier instante. Aunque
puede encontrarse una solución de (8.21) válida para cualquier tipo de movi-
miento, buscaremos en primer lugar soluciones particulares que serán válidas, por
separado, para cada tipo distinto de órbita.
Ley horaria del movimiento 133
8.5.2 Caso parabólico
En este caso h = 0 y por tanto la ecuación (8.21) se transforma en
r00 = µ.
De esta forma, una primera integración nos dará
r0 = µs+ C
1
,
donde C
1
tomará el valor cero por ser r0(s = 0) = 0. Por último
r =
µ
2
s2 + C
2
,
de donde C
2
= p/2 puesto que r(s = 0) = r(T ) = p/2. Por tanto, la solución
podrá ponerse como
r =
1
2
(µs2 + p). (8.22)
De acuerdo con esto, la cuadratura (8.19) puede ser fácilmente calculada obte-
niéndose
2(t� T ) =
µ
3
s3 + ps, (8.23)
relación conocida en Mecánica Celeste como ecuación de Barker.
En el caso parabólico se tiene e = 0 y por tanto
r =
p
1 + cos f
=
p
2
(1 + tan2
f
2
).
Comparando esta expresión con (8.22) obtendremos
tan2
f
2
=
µs2
p
.
No existirá ambigüedad de signo al extraer la ráız cuadrada si pensamos que s es
positivo cuando t > T o, lo que es igual, cuando f es positivo. Por tanto, podemos
poner
tan
f
2
=
r
µ
p
s, (8.24)
y por último
2
r
µ
p3
(t� T ) =
1
3
tan3
f
2
+ tan
f
2
. (8.25)
Para invertir esta relación basta definir dos ángulos f
1
, f
2
, tales que
tan
f
2
= 2 cot 2f
1
= cot f
1
� tan f
1
,
tan3 f
1
= tan
f
2
2
,
134 Integración del problema kepleriano
y de esta forma
tan3
f
2
= cot
f
2
2
� tan
f
2
2
+ 3(tan f � cot f) = 2 cot f
2
� 3 tan
f
2
,
luego finalmente se tendrá
2
r
µ
p3
(t� T ) =
2
3
cot f
2
,
relación que permite obtener a partir de t, f
2
y posteriormente f
1
y f .
8.5.3 Caso eĺıptico
En el caso eĺıptico (�2h) > 0 y la solución de la ecuación (8.21) podrá ponerse
como
r = a+ C
1
cos(
p
�2hs+ C
2
), (8.26)
donde C
1
, C
2
son las constantes de integración, y a = �µ/2h es el semieje mayor
de la elipse. Derivando la expresión de r se tendrá
r0 = �C
1
p
�2h sen(
p
�2hs+ C
2
).
Sustituyendo los valores iniciales y teniendo en cuenta que, en este caso, la dis-
tancia en el periastro es r
p
= a(1� e) se obtendrán las relaciones:
C
1
cosC
2
= �a e, C
1
senC
2
= 0,
de donde se deduce que C
1
= �a e, C
2
= 0 y por tanto
r = a(1� e cos[
p
�2hs]). (8.27)
De acuerdo con esta relación la cuadratura (8.19) podrá ponerse como
1
a
(t� T ) =
Z
s
0
(1� e cos[
p
�2hs]) d s = 1p
�2h
hp
�2hs� e sen(
p
�2hs)
i
.
En la expresión anterior puede observarse la necesidad de introducir una nueva
variable, E =
p
�2hs, que serállamada anomaĺıa excéntrica. De esta forma, la
ecuación anterior se podrá poner como
p
�2h
a
(t� T ) = E � e senE.
Por otro lado, introduciendo una constante n > 0, por medio de la expresión
µ = n2a3, (8.28)
y teniendo en cuenta la relación µ = (�2h)a, podremos poner
n(t� T ) = ` = E � e senE, (8.29)
Ley horaria del movimiento 135
que será llamada ecuación de Kepler y donde hemos introducido la anomaĺıa
media ` = n(t� T ).
Si tenemos en cuenta la relación (8.28) y la comparamos con la tercera ley de
Kepler del movimiento eĺıptico (8.12) podemos deducir que
n =
2⇡
P
,
es decir, n representaŕıa la velocidad angular si el movimiento fuese circular, con
velocidad angular constante, por ello, llamaremos a n movimiento medio y en
adelante podremos llamar tercera ley de Kepler tanto a (8.12) como a (8.28).
La definición de anomaĺıa excéntrica y la expresión (8.27) permiten expresar
r en función de E en la forma
r = a(1� e cosE). (8.30)
Para establecer la relación entre la anomaĺıa verdadera y la anomaĺıa excéntrica,
basta tener en mente las relaciones
r =
a(1� e2)
1 + e cos f
= a(1� e cosE),
de donde, despejando cos f , se tiene
cos f =
cosE � e
1� e cosE
, (8.31)
lo que permite poner
2 sen2
f
2
= 1� cos f =
(1 + e)(1� cosE)
1� e cosE
=
1 + e
1� e cosE
2 sen2
E
2
,
2 cos2
f
2
= 1 + cos f =
(1� e)(1 + cosE)
1� e cosE
=
1� e
1� e cosE
2 cos2
E
2
,
O
P 0
P
fE
Figura 8.3: Relación entre las anomaĺıas verda-
dera y excéntrica
y dividiendo ambas igualdades se
obtiene finalmente
tan
f
2
=
r
1 + e
1� e
tan
E
2
, (8.32)
que es la fórmula más frecuente-
mente empleada para relacionar
las dos anomaĺıas, pues es fácil-
mente invertible y porque el uso
de la tangente del ángulo mitad
nos asegura el cuadrante correcto
en la obtención de la anomaĺıa.
136 Integración del problema kepleriano
Las relaciones entre estas anomaĺıas permiten comprobar el significado geomé-
trico de E que puede verse en la figura 8.3. En efecto, un punto P 0 en una circun-
ferencia de radio a, cuya coordenada x coincida con la del astro P en su órbita,
forma un ángulo E con el eje de la elipse, medido éste desde el centro de la elipse.
Las distintas anomaĺıas en un problema kepleriano eĺıptico representan varia-
bles angulares que recorren un arco igual a 2⇡ mientras t recorre todo un periodo
P .
Puede verse fácilmente que en el movimiento circular las tres anomaĺıas coin-
ciden.
8.5.4 Resolución de la ecuación de Kepler
El cálculo de la anomaĺıa media ` a partir de la excéntrica E es inmediato por
aplicación directa de la ecuación de Kepler. Sin embargo, no lo es el caso inverso.
No existe ninguna expresión algebraica cerrada que nos resuelva este problema,
por lo que obtendremos de manera separada las dos aproximaciones posibles al
mismo. Por un lado, la resolución numérica de la ecuación de Kepler, por otro, su
resolución por medio de un desarrollo en serie.
Por la simplicidad de la ecuación de Kepler, bastará en general, salvo para ex-
centricidades muy grandes, utilizar el método de Newton–Raphson para el cálculo
aproximado de ráıces de una ecuación no lineal.
Si queremos encontrar la solución de la ecuación �(x) = 0 y x
0
es un valor
aproximado de dicha solución, el método de Newton–Raphson nos asegura que la
sucesión de números
x
n
= x
n�1
� �(x
n�1
)
�0(x
n�1
)
, (8.33)
converge a la raiz de la ecuación �(x) = 0.
En nuestro caso, la ecuación es
�(E) = `� E + e senE = 0.
Para excentricidades pequeñas el valor de E debe ser próximo a `, por lo que
en general será suficiente tomar E
0
= `, o bien E
0
= ` + e sen `, y construir la
sucesión:
E
n
= E
n�1
+
`� (E
n�1
� e senE
n�1
)
1� e cosE
n�1
, (8.34)
que converge al valor deseado.
De acuerdo con la ecuación de Kepler, y en las condiciones del teorema de la
función impĺıcita, E puede ser vista como función de e y `, desarrollable en serie
de potencias de e en la forma
E(e, `) =
X
j�0
@jE
@ej
�
�
�
�
e=0
ej
j!
.
Ley horaria del movimiento 137
Basta encontrar las derivadas de E respecto a la excentricidad y particularizar su
valor para e = 0 para obtener los coeficientes de dicho desarrollo.
De acuerdo con la ecuación de Kepler se tendrá
E � e senE = ` =) (E)
e=0
= `,
y derivando sucesivamente la misma ecuación obtendremos
@E
@e
� senE � e cosE
@E
@e
= 0 =) @E
@e
�
�
�
�
e=0
= sen `,
para la derivada primera,
@2E
@e2
� cosE
@E
@e
� cosE
@E
@e
+ e senE(
@E
@e
)2 � e cosE
@2E
@e2
= 0 =)
@2E
@e2
�
�
�
�
e=0
= 2 sen ` cos ` = sen 2`,
para la derivada segunda, etc.
Finalmente obtenemos
E = `+ e sen `+
e2
2
sen 2`+
e3
8
(sen 3`� sen `) + . . .
y reordenando términos, tomando hasta orden 5 en e, se obtiene
E � ` = (e� e3
8
+
e5
192
+ . . .) sen `+
(
e2
2
+
e4
6
+
e6
32
+ . . .) sen 2`+
(
3e3
8
� 27e5
128
+ . . .) sen 3`+
(
e4
3
+ . . .) sen 4`+
(
125e5
384
+ . . .) sen 5`+ . . .
Hay que hacer notar que la serie anterior no es absolutamente convergente, por
lo que la reordenación de términos efectuada modifica el radio de convergencia,
siéndolo únicamente para e < 0.6627. Además, la convergencia es muy lenta, por
lo que tendrá muy poca aplicación práctica si los valores de la excentricidad no
son muy pequeños.
Aunque hemos obtenido únicamente la expresión de E como desarrollo en serie
de potencias de e, de manera similar podemos obtener desarrollos de senE y cosE
y a partir de éstos podemos expresar cualquier función de la forma
⇣ r
a
⌘
n
,
⇣ r
a
⌘
n
cosmf,
⇣ r
a
⌘
n
senmf,
138 Integración del problema kepleriano
para n,m enteros cualesquiera, dando lugar a los desarrollos de Hansen que per-
miten expresar expĺıcitamente cualquier variable del movimiento orbital eĺıptico
como función de `, y por tanto de t.
8.5.5 Caso hiperbólico
En este caso h > 0 y la solución de (8.21) se expresará como
r = �a+ C
1
cosh(
p
2h s+ C
2
),
donde C
1
, C
2
son las constantes de integración y a = µ/2h el semieje mayor de la
hipérbola. Derivando tenemos:
r0 =
p
2hC
1
senh(
p
2h s+ C
2
),
r00 = 2hC
1
cosh(
p
2h s+ C
2
),
de donde, sustituyendo los valores iniciales y teniendo en cuenta que la distancia
en el periastro es ahora r
p
= a(e� 1), se tendrán las relaciones:
C
1
cosh(C
2
) = a e, C
1
senh(C
2
) = 0,
de las cuales deducimos que C
1
= a e, C
2
= 0, y por último
r = a(e cosh[
p
2h s]� 1). (8.35)
De acuerdo con esta relación, la cuadratura (8.19) podrá ponerse como
1
a
(t� T ) =
Z
s
0
(e cosh[
p
2h s]� 1)d s =
1p
2h
[e senh(
p
2h s)�
p
2h s].
Si introducimos la nueva variable F =
p
2h s podremos poner
p
2h
a
(t� T ) = e senhF � F.
Por otro lado si introducimos, al igual que en el movimiento eĺıptico, una constante
n tal que µ = n2a3, y teniendo en cuenta la relación µ = 2ha, podremos poner
finalmente
n(t� T ) = ` = e senhF � F. (8.36)
La ecuación anterior será llamada, por extensión, ecuación de Kepler del mo-
vimiento hiperbólico. Nótese que aqúı el movimiento medio n no tiene el mismo
significado que en el caso eĺıptico por no ser la órbita periódica, sin embargo, la
relación µ = n2a3 extiende al movimiento hiperbólico la tercera ley de Kepler.
La relación de r con F quedará establecida a partir de (8.35) como
r = a(e coshF � 1). (8.37)
Ley horaria del movimiento 139
Para establecer la relación con f bastará recordar que
r =
a(e2 � 1)
1 + e cos f
= a(e coshF � 1),
de donde, despejando cos f tendremos
cos f =
e� coshF
e coshF � 1
.
Por último, pasando al ángulo mitad como en el caso eĺıptico, se llega a
tan
f
2
=
r
e+ 1
e� 1
tanh
F
2
,
después de tomar la ráız positiva al no existir ambigüedad si consideramos que
cuando t > T , tanto f como F son positivas.
Para invertir la ecuación de Kepler en el caso hiperbólico usaremos también
el método de Newton con la iteración dada por (8.33). En este caso, tendremos
�(F ) = `+ F � e senhF = 0,y por tanto, considerando solo el caso de F y ` positivo, pues el negativo es
simétrico, la sucesión para invertir la ecuación será
F
n
= F
n�1
+
`+ (F
n�1
� e senhF
n�1
)
e coshF
n�1
� 1
. (8.38)
Para encontrar el valor inicial de la sucesión F
0
expresaremos la ecuación de
Kepler del movimiento hiperbólico (8.36) en términos de la función exponencial
en lugar del seno hiperbólico
e
2
exp(F ) +
e
2
exp(�F )� F � ` = 0. (8.39)
Si suponemos que F no es demasiado pequeño podemos admitir que el suman-
do e exp(F )/2 es mucho mayor que e exp(�F )/2� F y que, por tanto, podremos
poner
e
2
exp(F )� ` ⇡ 0, luego podemos tomar como valor inicial
F
0
= Log
✓
2`
e
◆
.
Se ha comprobado que el número de iteraciones se reduce si en lugar de este valor
inicial se toma
F
0
= Log
✓
2`
e
+ k
◆
, k > 0,
lo que proviene de no despreciar totalmente el término F de (8.39). Un valor
óptimo de k es el valor k = 1.8.
140 Integración del problema kepleriano
Caṕıtulo 9
Órbitas keplerianas
9.1 Caracterización de las órbitas keplerianas
Llamaremos órbita kepleriana, y la denotaremos con el śımbolo O, a la solución
de las ecuaciones del problema kepleriano (8.1) para unas condiciones iniciales
dadas. Entenderemos por órbita, no solo la trayectoria del orbitador, sino todos
sus parámetros, tanto estáticos o constantes, como dinámicos o variables.
Las ecuaciones del problema kepleriano (8.1) constituyen un sistema de seis
ecuaciones diferenciales de orden uno. De acuerdo con la teoŕıa de ecuaciones dife-
renciales ordinarias una solución de dicho sistema vendrá dada como x = x(t,C),
donde C = (C
1
, C
2
, C
3
, C
4
, C
5
, C
6
) representa un vector de seis constantes in-
dependientes que llamaremos variables de estado porque permiten determinar
cualquier parámetro de la órbita en cualquier instante, es decir, caracterizan la
órbita.
Los seis elementos que componen las variables de estado son constantes de
la órbita o variables dinámicas particularizadas para un instante dado. En este
último caso hay que dar el valor de éstas aśı como el instante t
0
en que han sido
calculadas.
Una vez determinado el conjunto de variables de estado, la órbita quedará ca-
racterizada por éste y pondremos O(C) si los elementos del vector de estado son
constantes de la órbita y O(t
0
,C) si son variables particularizadas en t
0
.
Las variables de estado pueden ser elegidas de diversas maneras. La más na-
tural, desde el punto de vista de las ecuaciones diferenciales, es a través de los
valores del vector de posición, x
0
, y velocidad, X
0
, para un instante dado. Al
142 Órbitas keplerianas
vector de dimensión seis, compuesto por las componentes de los vectores x
0
y
X
0
, se le llama vector de estado. De esta forma una órbita kepleriana podrá ser
representada como O(t
0
,x
0
,X
0
).
Cada aspecto y propiedad de una órbita kepleriana O puede ser representa-
do por un parámetro orbital o variable dinámica. Estos parámetros pueden ser
constantes, como la excentricidad e o la norma del momento angular G, o varia-
bles, como el vector de posición x o la anomaĺıa verdadera f . Una vez conocidos
los seis o siete elementos que caracterizan la órbita, ésta queda completamente
determinada junto con todos sus parámetros.
En el caso de que un parámetro, que de forma genérica llamaremos �, sea
constante, utilizaremos la notación �(O), pues este parámetro solo depende de
la órbita, sin embargo, cuando el parámetro sea variable dependerá a su vez del
instante o época orbital ⌧ en que sea calculado, por lo que pondremos �(⌧,O).
Aśı como la órbita se pod́ıa caracterizar por distintos conjuntos de elemen-
tos, el instante en que calculamos un parámetro orbital variable también puede
representarse en distintas formas:
tiempo absoluto t,
tiempo relativo al periastro t� T ,
anomaĺıa media `,
anomaĺıa excéntrica E,
anomaĺıa verdadera f ,
alguna posición particular: periastro, apoastro, nodo, etc.
Conociendo uno cualquiera de los elementos anteriores y la propia órbita, los
algoritmos vistos en el caṕıtulo anterior permiten obtener los demás, por lo que
cualquiera de ellos caracteriza el instante o época orbital ⌧ .
Las variables de estado constituyen un conjunto de seis elementos indepen-
dientes entre si, sin embargo, cuando comparamos dos conjuntos de variables de
estado deberán existir relaciones de dependencia entre ambos, pudiéndose obtener
los primeros en función de los segundos y viceversa. Hay que tener en cuenta que
cualquiera de las variables de estado es un parámetro orbital y por lo tanto debe
ser posible su obtención en función de cualquier otro conjunto de variables de
estado.
En lo que sigue veremos varios conjuntos distintos de variables de estado.
Además del vector de estado estudiaremos también los elementos orbitales y varios
conjuntos de variables derivados de ellos, aśı como las variables de Delaunay y las
variables polares-nodales. La demostración de que dichos conjuntos representan
variables de estado de la órbita vendrá de obtener cada conjunto de elementos en
función de otro que ya lo sea y viceversa.
Elementos orbitales ordinarios 143
9.2 Elementos orbitales ordinarios
La integración de este problema, vista en el caṕıtulo anterior, conduce a la
obtención de seis constantes,G,A, que caracterizan muchas de las propiedades del
movimiento kepleriano. Ya hemos visto que entre estos vectores existe una relación
funcional, luego no definen un conjunto de variables de estado sino que representan
únicamente cinco de los seis elementos necesarios. Sin embargo, ninguno de estos
cinco elementos representa directamente las propiedades de la órbita por lo que su
uso no será de utilidad práctica. En su lugar usaremos algunos de los parámetros
que definen la geometŕıa de la trayectoria. El sexto elemento deberá añadirse
después de considerar algún parámetro relacionado con la dinámica del orbitador.
En primer lugar tomaremos los dos elementos que caracterizan la forma de la
cónica, esto es, el semieje mayor a (o el semilado recto1 p) y la excentricidad e.
En el caso de órbitas de cometas suele sustituirse el semieje a por una cantidad,
q, que representa la distancia del cometa al Sol en el perihelio. La distancia en
el perihelio vale q = r
p
= a(1 � e), por lo que conocido q puede hallarse a y
por tanto a puede sustituirse por q. Para satélites artificiales se sustituye el par
de elementos a, e, por la mı́nima y máxima altitud r
m
, r
M
, del satélite sobre la
superficie terrestre. La relación de estas cantidades con la distancia en el perigeo y
el apogeo viene dada por r
p
= r
m
+r�, ra = r
M
+r�, y a partir de ellos podemos
obtener a = (r
a
+ r
p
)/2, e = (r
a
� r
p
)/(r
a
+ r
p
).
Las variables a y e, o cualquiera de sus variantes, caracterizan la forma y
dimensiones de la cónica. Para completar la información sobre la trayectoria ne-
cesitaremos situarla en el espacio, para lo cual basta observar la figura 9.1 y
recordar que la órbita está contenida en un plano perpendicular al vector G o, lo
que es igual, a su dirección n. Supondremos, por ahora, que la órbita no coincide
con el plano Oxy del sistema espacial, esto es, que n⇥ e
3
6= 0.
Puesto que el plano de la órbita y el plano fundamental del sistema espacial
Oxy no son paralelos, necesariamente se cortarán en una recta que pasa por O y
pertenece a ambos planos y que llamaremos ĺınea de los nodos. Tomaremos como
dirección positiva de dicha recta la que contiene el nodo ascendente, o punto de
la órbita en el que el orbitador pasa de coordenadas z negativas a positivas. El
vector unitario l define la ĺınea de los nodos y forma un ángulo ⌦, ángulo del
nodo, con e
1
. El ángulo ⌦ puede tomar cualquier valor entre 0 y 2⇡.
El ángulo que forman el vector n con e
3
será llamado inclinación, y denotado
por i, y representa también el ángulo entre el plano Oxy y elde la órbita. El
ángulo i puede tomar un valor cualquiera entre 0 y ⇡.
El vector n representa también el sentido de la rotación de la part́ıcula al-
rededor del eje definido por n pues, debido a su definición, ésta tiene siempre
lugar en sentido contrario a las agujas del reloj si se observa desde el extremo
de n. Aśı pues, el ángulo que forma n con e
3
indica también el sentido de giro
1Recordemos que el semieje mayor no está definido para la parábola.
144 Órbitas keplerianas
O
P
x A
l
u
a
n
e
1
e
2
e
3
⌦
!
f
i
i
Figura 9.1: Órbita kepleriana en el espacio.
observado desde un punto cualquiera de la parte positiva del eje Oz. Un ángulo i
entre 0 y ⇡/2 indicará una órbita directa (sentido de giro contrario a las agujas del
reloj), mientras que una inclinación entre ⇡/2 y ⇡ indicará una órbita retrógrada
(sentido de giro igual al de las agujas del reloj). De esta forma, podemos separar
el sentido de giro observado de la dinámica del sistema, en la que consideraremos
siempre ḟ > 0, esto es, una anomaĺıa verdadera estrictamente creciente.
Los dos ángulos ⌦, i representan la posición del plano de la órbita en el espacio,
pero para poder situar con exactitud la cónica en el espacio hay que situar la
dirección del eje de la cónica dentro de su plano. El eje de la cónica lleva la
dirección de la ĺınea de los ápsides, a, que forma un ángulo ! con la ĺınea de los
nodos. Dicho ángulo será llamado argumento del periastro, representa la posición
relativa de la cónica en su plano y es la tercera variable angular de la órbita. El
argumento del periastro toma un valor cualquiera entre 0 y 2⇡.
Cuando la inclinación de la órbita vale cero, la ĺınea de los nodos no está defi-
nida, por lo que tampoco lo estarán ⌦ ni !. En esta ocasión tiene sentido definir
el ángulo entre la dirección de e
1
y la de a, ángulo que llamaremos longitud del
periastro !̃. Nótese que dicho parámetro tiene también sentido para órbitas de
inclinación no nula sin más que definirlo como !̃ = ⌦+ !.
Por otro lado, cuando e = 0, queda indefinido a y por tanto quedan indefinidos
! y !̃. Para eliminar esta indefinición se introduce la longitud media a través de
la relación � = !̃+ ` = ⌦+ !+ `, que contiene la anomaĺıa media `, y que queda
definida, tanto para órbitas circulares, como para cualquier otro tipo de órbita.
Variables no singulares 145
Se han completado aśı los cinco elementos que caracterizan la forma, dimen-
siones y situación en el espacio de la órbita. Para caracterizar su dinámica basta
considerar la constante T que indica la época en la que el orbitador pasa por el
periastro. Aunque el elemento T es constante hay que tener en cuenta que, para
órbitas eĺıpticas, éste vaŕıa de una vuelta a otra aumentando en una cantidad
igual al periodo orbital P . Además, de la misma forma que se sustituyen a y e,
puede sustituirse T por � = �nT . Otra alternativa, muy frecuentemente usada
para definir la sexta constante, es el valor de la anomaĺıa media, `
0
, en un cierto
instante t = t
0
.
Llamaremos elementos orbitales al conjunto de seis constantes (a, e, i,⌦,!, T ),
sin embargo, en ocasiones, atendiendo a las caracteŕısticas de la órbita pueden
modificarse éstos y sustituirse por algunos de los valores alternativos anteriores.
Por ejemplo, para el estudio de órbitas planetarias, que tienen inclinaciones y
excentricidades muy pequeñas, suele utilizarse, en lugar de los elementos orbitales
el conjunto de constantes (a, e, i,⌦, !̃,�
0
), donde �
0
es la longitud media en un
instante inicial t
0
dado.
La equivalencia entre los elementos orbitales y los elementos (t
0
,x
0
,X
0
), que-
dará probada si demostramos que unos se pueden obtener a partir de los otros y vi-
ceversa, lo que comprobaremos posteriormente en este mismo caṕıtulo. Por tanto,
la órbita se puede caracterizar como O(a, e, i,⌦,!, T ) o bien como O(t
0
,x
0
,X
0
).
A partir de esta equivalencia, para probar que cualquier otro conjunto de seis
constantes o de seis constantes y variables, junto con el instante en que se han
medido o calculado, caracterizan la órbita O basta comprobar su equivalencia con
los elementos orbitales.
9.3 Variables no singulares
El problema que aparece cuando la excentricidad, e, o la inclinación, i, toman
valores muy pequeños o cero, no es tanto la indefinición de las variables, sino la
aparición de singularidades debidas a la existencia de términos en e y sen i en los
denominadores de las ecuaciones que expresan el movimiento orbital perturbado.
Para evitar este tipo de singularidades se introduce un nuevo conjunto de variables
que son llamadas variables equinocciales o variables no singulares y que se definen
por medio de las expresiones:
a, h = e sen !̃, k = e cos !̃,
� = !̃ + `
0
, p = tan
i
2
sen⌦, q = tan
i
2
cos⌦.
(9.1)
Estas variables2 han sido definidas, en ocasiones, a través de términos en tan i
o sen i en lugar de tan i/2, sin embargo, esto introduce otro tipo de singularidades
para órbitas de inclinación i = 90�. Las variables, tal como las hemos definido
2No confundir la h de las variables equinocciales con la enerǵıa de la órbita.
146 Órbitas keplerianas
nosotros, son válidas para 0 i < 180�. Otro conjunto de variables similar, que se
usa para órbitas retrógradas, son las llamadas variables equinocciales retrógradas,
definidas por las relaciones
a, h
r
= e sen !̃, k
r
= e cos !̃,
� = !̃ + `
0
, p
r
= cot
i
2
sen⌦, q
r
= cot
i
2
cos⌦,
(9.2)
válidas para 0 < i 180�.
9.4 Sistemas de referencia orbitales
Hemos dedicado la primera parte de este libro al estudio de los sistemas de re-
ferencia espaciales cuyo conocimiento es imprescindible para ubicar con precisión
la posición de cualquier cuerpo en el espacio. Las caracteŕısticas del movimiento
orbital hacen necesaria la introducción de nuevos sistemas de referencia, adap-
tados a este problema, donde se formulen, de manera sencilla, algunos de los
parámetros del mismo. En las figuras (9.2), (9.3), (9.4), (9.5), (9.6), se represen-
tarán con ĺınea discontinuas tanto los vectores de la base del sistema de referencia
como el octante que estos forman. Asimismo, en lugar de la órbita y el ecuador
(o la ecĺıptica en su caso) se representará su proyección en una esfera unidad, por
lo que todos los vectores mostrados serán unitarios, incluida la posición x que se
sustituirá por su dirección u.
9.4.1 Sistema espacial
↵(�)
�(�)
e
1
e
2
e
3
u
n
Figura 9.2: Sistema espacial {e1, e2, e3}.
Coordenadas astronómicas del orbitador.
Para la integración del problema
de los dos cuerpos hemos supuesto
que estamos refiriendo todos los vec-
tores a un sistema de referencia iner-
cial, con centro en el cuerpo central
de la órbita, al que llamaremos siste-
ma espacial3 y que denotaremos S =
{e
1
, e
2
, e
3
}. En este sistema los vec-
tores de posición y velocidad se expre-
sarán como:
x = x e
1
+ y e
2
+ z e
3
,
X = X e
1
+ Y e
2
+ Z e
3
,
(9.3)
o lo que es igual, con la notación introducida en el caṕıtulo 2, pondremos:
xS =
0
@
x
y
z
1
A , XS =
0
@
X
Y
Z
1
A . (9.4)
3En el caso de órbitas de satélites éste será el sistema S
G
(S
P
) descrito en la página 59.
Sistemas de referencia orbitales 147
Si la órbita representada es la de un satélite artificial, o un satélite natural (lu-
na) en torno a un planeta, el sistema espacial adecuado será un sistema ecuatorial
y por tanto podremos poner
xS = cart(r,↵, �), (9.5)
donde ↵, � representan la ascensión recta y declinación. El sistema espacial más
adecuado, en el caso de órbitas en torno al Sol, será ecĺıptico y por tanto pondre-
mos
xS = cart(r,�,�), (9.6)
donde �,� representan la longitud y latitud ecĺıptica respectivamente.
De aqúı en adelante supondremos, salvo que se indique lo contrario, órbitas
de satélites expresadas en un sistema ecuatorial en la forma (9.5).
9.4.2 Sistema nodal–espacial
e1
e
3
u
n
l
e
3
⇥ l
↵� ⌦
�
Figura 9.3: Sistema nodal–espacial {l, e3 ⇥
l, e3}.
Sustituiremos la dirección de e
1
como origen de coordenadas por la del
vector l que representa la dirección de
la ĺınea de los nodos. De esta forma,
tendremos un nuevo sistema de refe-
rencia, P = {l, e
3
⇥ l, e
3
}, que lla-
maremos sistema nodal–espacial. Es
fácil observar que el paso del sistema
espacial al sistema nodal–espacial se
efectúa por medio de una matriz de
giro que realiza una rotación elemen-
tal de eje Oz y ángulo ⌦.
GSP = R
3
(⌦). (9.7)
Como puede observarse en la figu-
ra 9.3 las coordenadas polares del vector x, en el sistema espacial–nodal, son
(r,↵� ⌦, �), por lo que podremos escribir
xP = cart(r,↵� ⌦, �) =
0
@
r cos � cos(↵� ⌦)
r cos � sen(↵� ⌦)
r sen �
1
A . (9.8)
9.4.3 Sistema nodal
A partir de la dirección n del momento angular G, esto es G = Gn, y de
la ĺınea de los nodos l, que es perpendicular a n, podemos definir un sistema
de referencia ortogonal directo N = {l,m,n}, que llamaremos sistema nodal,
introduciendo el vector m = n⇥ l.
148 Órbitas keplerianas
e
1
e
2
e
3
u
n
l
m
! + f
Figura 9.4: Sistema nodal {l,m,n}.
Fácilmente se observa en la figura
9.4 que para pasar del sistema nodal-
espacial al nodal basta girar alrededor
de l un ángulo igual a la inclinación
i, por tanto tendremos
GPN = R
1
(i). (9.9)
Finalmente, para obtener la ma-
triz de giro del sistema espacial al no-
dal basta combinar las dos anteriores,
obteniéndose
GSN = GSPGPN = R
3
(⌦)R
1
(i).
(9.10)
Las columnas de la matriz de rotación GSN representan las componentes de
los vectores de la base final (nodal) en términos de la inicial (espacial), por ello,
podremos poner:
l = cos⌦ e
1
+ sen⌦ e
2
,
m = � cos i sen⌦ e
1
+ cos i cos⌦ e
2
+ sen i e
3
,
n = sen i sen⌦ e
1
� sen i cos⌦ e
2
+ cos i e
3
.
(9.11)
Usando este sistema de referencia puede encontrarse una expresión sencilla
de las coordenadas ecuatoriales de un satélite artificial. En efecto, basta tener en
cuenta que el ángulo entre l y x es igual a ! + f y por tanto podremos poner
xN = cart(r,! + f, 0) =
0
@
r cos(! + f)
r sen(! + f)
0
1
A . (9.12)
Si además tenemos en cuenta la relación xP = GPNxN = R
1
(i)xN , aśı como la
expresión (9.8), obtendremos finalmente
0
@
cos � cos(↵� ⌦)
cos � sen(↵� ⌦)
sen �
1
A =
0
@
cos(! + f)
cos i sen(! + f)
sen i sen(! + f)
1
A , (9.13)
o bien, de forma más precisa:
↵� ⌦ = polar
�
(R
1
(i)xN ),
� = polar
�
(R
1
(i)xN ),
(9.14)
que nos da las coordenadas astronómicas del orbitador en términos de los elemen-
tos orbitales y las funciones polar
�
,polar
�
definidas en (1.32).
Dividiendo entre si las dos primeras componentes de (9.13) llegamos a las
relaciones:
sen � = sen i sen(! + f),
tan(↵� ⌦) = cos i tan(! + f).
(9.15)
Sistemas de referencia orbitales 149
9.4.4 Sistema apsidal
e
1
e
2
e
3
u
n
l
a
b
!
Figura 9.5: Sistema apsidal {a, b,n}.
Si usamos la ĺınea de los ápsides
como eje Ox, en lugar de la ĺınea de
los nodos, definiremos un nuevo siste-
ma de referencia que llamaremos sis-
tema apsidal. Para ello, tendremos en
cuenta que los vectores a y n son or-
togonales y, por tanto, podemos defi-
nir el vector b = n⇥a y con él el sis-
tema de referencia ortogonal directo
A = {a, b,n} que será llamado siste-
ma apsidal.
El sistema apsidal tiene el mismo
eje Oz que el nodal y los vectores a, b
están girados un ángulo ! respecto de
l,m. Por ello, la matriz de giro del
sistema nodal al apsidal vendrá dada por
GNA = R
3
(!),
por lo que la relación entre los vectores de ambas bases vendrá dada por las
expresiones:
a = cos! l + sen! m,
b = � sen! l + cos! m.
(9.16)
Finalmente la matriz de giro del sistema espacial al apsidal vendrá dada por
GSA = R
3
(⌦)R
1
(i)R
3
(!).
Si tenemos en cuenta las propiedades de las cónicas y que la ĺınea de los ápsides
representa el eje de coordenadas polares podremos poner
xA = cart(r, f, 0) =
0
@
r cos f
r sen f
0
1
A . (9.17)
9.4.5 Sistema orbital
Tanto el sistema nodal como el apsidal representan sistemas fijos y, por tanto,
inerciales. Sin embargo, en ocasiones es conveniente usar otro, que será móvil,
pero cuyo eje Ox coincida con la dirección radial. Para ello, llamaremos u al
vector unitario en la dirección radial, de forma que x = ru, y v al definido por
v = n⇥ u. Al sistema U = {u,v,n} le llamaremos sistema orbital.
150 Órbitas keplerianas
e
1
l
e
2
e
3
u
n
v
Figura 9.6: Sistema orbital {u,v,n}.
Los vectores (u,v) se obtienen a
partir de (a, b) por medio de un giro
alrededor de n y ángulo f , y a partir
de (l,m) por medio de un giro alre-
dedor de n y ángulo ! + f . Por esto
podemos definir las siguientes matri-
ces de giro:
GAU = R
3
(f),
GNU = R
3
(! + f),
GSU = R
3
(⌦)R
1
(i)R
3
(! + f).
La expresión de los vectores del
sistema orbital en función de los del sistema espacial vendrá dada por:
u = (cos⌦ cos(f + !)� cos i sen⌦ sen(f + !)) e
1
+(sen⌦ cos(f + !) + cos i cos⌦ sen(f + !)) e
2
+sen i sen(f + !) e
3
,
v = �(cos⌦ sen(f + !) + cos i sen⌦ cos(f + !)) e
1
�(sen⌦ sen(f + !)� cos i cos⌦ cos(f + !)) e
2
+sen i cos(f + !) e
3
.
(9.18)
Teniendo en cuenta la definición de u y la expresión del vector velocidad en
el sistema orbital dada en (6.10) podremos poner:
x = ru ,
X = ṙu + rḟv ,
(9.19)
o lo que es igual
xU =
0
@
r
0
0
1
A , XU =
0
@
ṙ
rḟ
0
1
A . (9.20)
9.4.6 Sistema de Frenet
En Astrodinámica es muy usado otro sistema de referencia en el que el plano
Oxy también coincide con el plano del movimiento, pero en el que la dirección
principal coincide con la del vector velocidad, también llamada dirección tangente.
En efecto, el vector velocidad podrá ponerse como X = v t, donde v es la norma
y t la dirección del vector velocidad o tangente a la trayectoria. Tomando la
dirección t como eje Ox y n como eje Oz, definiremos el sistema de referencia
ortonormal directo F = {t,w,n} que será llamado, de aqúı en adelante, sistema
de Frenet. Este sistema es también llamado triedro de Frenet.
Relaciones entre el vector de estado y los elementos orbitales 151
u
t
t
a
b
�
Figura 9.7: Ángulo entre la dirección ra-
dial y tangente o ángulo de trayectoria de
vuelo.
La notación empleada aqúı no coin-
cide con la usada habitualmente en
Matemáticas, pues la dirección defini-
da por w, que nosotros llamaremos di-
rección normal a la tangente suele lla-
marse normal y por ello se emplea la
notación, n, mientras que la definida
por n, suele llamarse binormal y se de-
nota b.
Si llamamos � (figura 9.7) al ángulo
entre u y t, medido en sentido directo,
con la orientación definida por n, y tenemos en cuenta la expresión (1.25) tendre-
mos
� = atan(t · u, t · v), (9.21)
que de acuerdo con la segunda de las expresiones (9.19) podrá ponerse como
� = atan(
ṙ
v
,
rḟ
v
). (9.22)
Al ángulo � se le denomina ángulo de trayectoria de vuelo.
9.5 Relaciones entre el vector de estado y los ele-
mentos orbitales
Hasta aqúı hemos visto la definición de dos tipos de variables de estado: el
vector de estado, formado por la posición x
0
y la velocidad X
0
en un instante
t
0
y los elementos orbitales. En este apartado veremos las relaciones entre estos
dos conjuntos de variables de estado que permitirán obtener cada uno de ellos en
función del otro.
La obtención de los elementos orbitales a partir de una posición y velocidad
forma parte de un problema más general llamado determinación de órbitas que
intenta obtener los elementos de una órbita kepleriana a partir de datos de obser-
vación de la misma. Al problema inverso que nos da la posición y velocidad en un
instante a partir de los elementos orbitales le llamaremos cálculo de efemérides.
152 Órbitas keplerianas
9.5.1 Determinación de la órbita a partir de las condiciones
iniciales
Supongamos conocidas la posición y la velocidad x
0
,X
0
en un instante dado
t
0, aśı como la constante µ. Fácilmente podemos obtener:
r
0
= kx
0
k,
G = x
0
⇥X
0
, G = kG k,
A = X
0
⇥G� µ
r
0
x
0
, A = kA k,
h =
1
2
X
0
·X
0
� µ
r
0
.
Por tanto, aparte de las constantes de integración G,A, h, hemos obtenido tam-
bién los elementos:
e =
A
µ
, p =
G2
µ
,
y según que el valor de e sea menor o mayor que uno tendremos
a =
8
>
<
>
:
p
1� e2
, si e < 1,
p
e2 � 1
, si e > 1.
Una vez obtenida la forma de la órbita, buscaremos su posición relativa en el
espacio para lo cual encontraremos, en primer lugar, el valor de los vectores del
sistema orbital (u
0
,v
0
,n) para t = t
0
, expresados en el sistema espacial, a partir
de la expresiones:
u
0
=
x
0
r
0
, n =
G
G
, v
0
= n⇥ u
0
.
Si tenemos en cuenta la expresión del vector n dada en (9.11), podremos poner
sen⌦ sen i = n · e
1
,
� cos⌦ sen i = n · e
2
,
cos i = n · e
3
,
(9.23)
de donde:
i = acos(n · e
3
),
⌦ = atan(�n · e
2
,n · e
1
),
(9.24)
lo que nos da la inclinación y el ángulo del nodo de la órbita sin ningún tipo de
ambigüedad excepto en el caso en que la inclinación es cero (o 180�), pues enton-
ces la definición de ⌦ = atan(0, 0) no tiene sentido. En este caso adoptaremos,
por convenio, un valor ⌦ = 0. Además, puesto que conocemos A y A podemos
obtener a = A/A y tener en cuenta la expresión de a en el sistema espacial que,
Relaciones entre el vector de estado y los elementos orbitales 153
particularizada para i = 0, nos da a = cos(! + ⌦) e
1
+ sen(! + ⌦) e
2
, por lo que
en este caso tendremos
!̃ = atan(a · e
1
,a · e
2
), (9.25)
que sustituirá al argumento del periastro. Nótese que esta expresión no es válida
para inclinaciones distintas de 0� o 180�.
El cálculo de ! para inclinaciones distintas de 0� o 180� se realizará a partir
de las expresiones obtenidas de multiplicar por e
3
las expresiones de la base del
sistema orbital en función de las del sistema espacial, esto es:
u
0
· e
3
= sen i sen(! + f
0
),
v
0
· e
3
= sen i cos(! + f
0
),
(9.26)
de donde obtenemos
(! + f
0
) = atan (v
0
· e
3
,u
0
· e
3
) . (9.27)
Basta recordar que, de acuerdo con la definición de la anomaĺıa verdadera, se
tiene:
a · u
0
= cos f
0
,
a · v
0
= � sen f
0
,
(9.28)
luego
f
0
= atan(a · u
0
,�a · v
0
), (9.29)
lo que permite obtener !.
Una vez calculado f
0
y conocido el tipo de órbita, las relaciones entre t y f ,
obtenidas en el caṕıtulo 8, permiten obtener T sin más que hacer t = t
0
.
Si la excentricidad es igual a cero , esto es A = a = 0, no pueden aplicarse las
relaciones (9.25) ni (9.29). En este caso adoptaremos, por convenio, el valor a = l
si i 6= 0� o i 6= 180� y el valor a = e
1
= l si i = 0� o i = 180�.
9.5.2 Cálculo de efemérides
El cálculo de la posición x y la velocidad X en un instante t a partir de los
elementos orbitales puede obtenerse de manera inmediata formulando la rotación
que pasa del sistema espacial al orbital, esto es:
xS = GSUxU , XS = GSUXU ,
que, teniendo en cuenta las expresiones (9.20) y la expresión de la matriz de giro
GSU , permiten escribir:
0
@
x
y
z
1
A = R
3
(⌦)R
1
(i)R
3
(! + f)
0
@
r
0
0
1
A ,
0
@
X
Y
Z
1
A = R
3
(⌦)R
1
(i)R
3
(! + f)
0
@
ṙ
rḟ
0
1
A .
(9.30)
154 Órbitas keplerianas
Finalmente basta recordar las expresiones de r, ṙ y ḟ en función de f , dadas
en (8.8), (8.13), (8.14), y la relación de f con t, dada en el caṕıtulo 8 para cada
tipo de movimiento.
9.6 Intersección de dos órbitas keplerianas
La búsqueda de los posibles puntos de intersección de dos órbitas kepleria-
nas resulta de gran utilidad, tanto para detectar posibles colisiones (cometas o
asteroides con la Tierra, satélites artificiales entre si, etc.), como para conocer el
punto donde encender los motores de una nave y modificar aśı su órbita.
9.6.1 Pertenencia de un punto a una órbita
Antes de abordar este problema más general resolveremos un pequeño proble-
ma consistente en averiguar si una órbita kepleriana dada, O, pasa por un punto
P y si esto es aśı, determinar el instante de paso.
Supongamos conocido el vector de posición de P , xS , en el sistema espacial
S y llamemos xA al mismo vector en el sistema apsidal. Las relaciones entre los
distintos sistemas orbitales vistas anteriormente permiten poner
xA = GASxS ,
donde GAS es la matriz de paso del sistema apsidal al espacial para dicha órbita.
Las coordenadas polares esféricas de P en este sistema apsidal vendrán dadas por:
rA = polar
r
(GASxS ), �A = polar
�
(GASxS ), �A = polar
�
(GASxS ).
Si el punto P pertenece a la órbita O sus coordenadas polares esféricas en
el sistema apsidal serán (r, f, 0), por lo que finalmente podremos establecer las
condiciones de pertenencia y el instante de paso con las siguientes condiciones:
Un punto P , de vector de posición xS , pertenece a la órbita O si se cumplen,
simultáneamente, las condiciones:
rA =
p
1 + e cos(�A)
, �A = 0, (9.31)
siendo p y e el semilado recto y la excentricidad de la órbita O.
Si xS representa una dirección y no la posición exacta de un punto, basta la
segunda de las condiciones anteriores para asegurar que la órbita pasa por
algún punto que tiene la dirección xS .
Intersección de dos órbitas keplerianas 155
Si el punto P , de vector de posición xS , pertenece a la órbita O el instante
de paso del orbitador por ese punto puede calcularse a partir de su anomaĺıa
verdadera f dada por la relación
f = �A. (9.32)
Una vez establecidas las anteriores relaciones podemos abordar el cálculo del
punto o puntos, si los hay, que pertenecen simultáneamente a dos órbitas O
1
,O
2
.
Distinguiremos dos casos según que las órbitas sean coplanarias (mismo valor de
i,⌦ y n, o no lo sean.
9.6.2 Intersección de órbitas no coplanarias
En el caso de que las órbitas no sean coplanarias los vectores n
1
,n
2
, que
definen el plano de la órbita, no serán colineales, por lo que podremos definir las
direcciones:
u
a
=
n
1
⇥ n
2
kn
1
⇥ n
2
k , u
b
=
n
2
⇥ n
1
kn
2
⇥ n
1
k ,
que representan las dos únicas direcciones en las que las órbitas pueden tener
un punto común. Llamaremos u a cada una de las dos direcciones anteriores y
realizaremos el proceso siguiente para cada una de las dos.
En primer lugar calcularemos los valores:
f
1
= polar
�
(GA1Su), f
2
= polar
�
(GA2Su), (9.33)
que representan los valores de la anomaĺıa media de el posible punto de intersec-
ción en cada una de las órbitas.
De esta forma pueden calcularse los vectores
x
i
= x(f
i
,O
i
), i = 1, 2, (9.34)
que representan el vector de posición del posible punto de intersección en las
dos órbitas. Para comprobar que hay punto de intersección basta comprobar que
x
1
= x
2
.
9.6.3 Intersección de órbitas coplanarias
Excluiremos el caso en que a
1
= a
2
, e
1
= e
2
, i
1
= i
2
, ⌦
1
= ⌦
2
, !
1
= !
2
para
el que existen infinitos puntos comunes por ser órbitas coincidentes.
Supondremos por tanto que i
1
,= i
2
, ⌦
1
= ⌦
2
y que alguno o los tres elementos
a, e, i son distintos en las dos órbitas. En este caso n
1
y n
2
son colineales por lo que
no podemos determinar la dirección de la intersección por medio de el producto
vectorial de éstos.
156 Órbitas keplerianas
a
1
a
2
!
1
!
2
f
1 f
2
O
Nodo
r = r
1
= r
2
O
1
O
2
Figura 9.8: Punto de intersección de dos órbitas
coplanarias.
De acuerdo con la figura 9.8
impondremos que en el punto de
intersección la distancia r en am-
bas órbitas debe ser la misma,
por lo que podremos poner
r =
p
1
1� e
1
cos f
1
=
p
2
1� e
2
cos f
2
,
donde f
1
y f
2
corresponden a las
anomaĺıas verdaderas del punto o
los puntos de intersección en ca-
da una de las órbitas.
Puesto que el plano de am-
bas órbitas es el mismo, también
coincidirá la dirección del nodo,
por lo que se tendrá la relación
f
1
+ !
1
= f
2
+ !
2
,
lo que permite escribir
p
1
1 + e
1
cos f
1
=p
2
1 + e
2
cos(f
1
+ !
1
� !
2
)
,
expresión que, desarrollada, puede ponerse como
C cos f
1
+ S sen f
1
= P, (9.35)
siendo:
C = p
2
e
1
� p
1
e
2
cos(!
1
� !
2
),
S = p
1
e
2
sen(!
1
� !
2
),
P = p
1
� p
2
.
La ecuación (9.35) coincide con la expresión (1.10) por lo que usando su solu-
ción (1.11), que puede ser doble, única o incompatible, podremos poner
f
1
= atan(C, S) + sen
Pp
C2 + S2
, f
2
= f
1
+ !
1
� !
2
. (9.36)
que representan los valores de la anomaĺıa media de el posible punto de intersec-
ción en cada una de las órbitas.
Al igual que en caso no coplanario, los vectores x
i
= x(f
i
,O
i
), i = 1, 2,
representan el vector de posición del posible punto de intersección en las dos
órbitas. Para comprobar que hay punto de intersección basta comprobar que x
1
=
x
2
.
Variaciones de los sistemas de referencia 157
9.6.4 Colisiones
Una vez comprobada la existencia de uno o varios puntos de intersección de
las dos órbitas la comprobación de la colisión exige que los dos orbitadores pa-
sen simultáneamente por el punto intersección. Para comprobar esta condición
deberemos calcular en cada punto de intersección el valor del tiempo absoluto
t
i
= t(f
i
,O
i
) y comprobar que t
1
= t
2
.
9.7 Variaciones de los sistemas de referencia
La importancia del sistema S = {e
1
, e
2
, e
3
} radica en que, salvo el movi-
miento del origen, es un sistema inercial, esto es, se verifica que de
i
= 0. En el
problema keperiano los sistemas nodal y apsidal son también inerciales, sin em-
bargo, el sistema orbital y el sistema de Frenet no lo son. Cuando se consideran
las perturbaciones orbitales únicamente el sistema espacial sigue siendo inercial.
z
e
1
e
2
e
3
x
r
u
⇢
⇢
�
�
Figura 9.9: Coordenadas ciĺındricas y esféricas.
En este apartado obtendre-
mos la variación de dichos sis-
temas lo que además nos permi-
tirá definir, posteriormente, otros
dos conjuntos de variables de es-
tado: las variables de Delaunay
y las polares-nodales. Para ello
introduciremos un nuevo siste-
ma de referencia auxiliar, no de-
finido antes, y que está asocia-
do a las coordenadas ciĺındricas
y a las esféricas. A dicho sistema
le llamaremos sistema ciĺındrico,
y está formado por los vectores
(u
⇢
, e
3
⇥ u
⇢
, e
3
), donde u
⇢
defi-
ne la dirección de la proyección del orbitador en el plano fundamental definido por
e
1
y e
2
(figura 9.9). Si llamamos (�,�) a la longitud y latitud de P , tendremos
que:
u
⇢
= cos� e
1
+ sen� e
2
,
e
3
⇥ u
⇢
= � sen� e
1
+ cos� e
2
.
(9.37)
La variación de este sistema de referencia puede obtenerse diferenciando (9.37),
de forma que:
du
⇢
= � sen� d� e
1
+ cos� d� e
2
= (e
3
⇥ u
⇢
) d�,
d(e
3
⇥ u
⇢
) = � cos� d� e
1
� sen� d� e
2
= �u
⇢
d�.
(9.38)
Si en lugar de u
⇢
tomamos como eje Ox la dirección l de la intersección del
plano orbital con el plano fundamental podemos definir, por un lado, el sistema
nodal-espacial (l, e
3
⇥l, e
3
) (figura 9.3) y, por otro lado, el sistema nodal (l,m,n).
158 Órbitas keplerianas
En el primer caso tendremos:
l = cos⌦ e
1
+ sen⌦e
2
,
e
3
⇥ l = � sen⌦ e
1
+ cos⌦ e
2
,
(9.39)
de donde diferenciando obtenemos:
dl = (e
3
⇥ l) d⌦,
d(e
3
⇥ l) = �l d⌦. (9.40)
En el segundo:
m = cos i (e
3
⇥ l) + sen i e
3
,
n = � sen i (e
3
⇥ l) + cos i e
3
,
(9.41)
que diferenciadas dan:
dm = n di+ cos i d(e
3
⇥ l),
dn = �m di� sen i d(e
3
⇥ l).
(9.42)
Finalmente, reuniendo (9.40) y (9.42) se llega a
dl = (e
3
⇥ l) d⌦,
dm = n di� cos i l d⌦,
dn = �m di+ sen i l d⌦.
(9.43)
En este estudio prescindiremos del sistema apsidal, cuyas variaciones son
idénticas a las del orbital cambiando ✓ por !. Para estudiar las variaciones del
sistema orbital (u,v,n) recordemos que se verifica:
u = cos ✓ l+ sen ✓m,
v = � sen ✓ l+ cos ✓m,
(9.44)
y por tanto
du = v d✓ + cos⌦ dl+ sen ✓ dm
= v d✓ + cos ✓ (e
3
⇥ l) d⌦+ sen ✓n di� sen ✓ cos i l d⌦.
Si tenemos en cuenta que, de acuerdo con (9.41), se tiene e
3
⇥m = cos i (e
3
⇥
(e
3
⇥ l)) = � cos i l, podremos poner finalmente:
du = v d✓ + sen ✓n di+ (e
3
⇥ u) d⌦,
dv = �u d✓ + cos ✓n di+ (e
3
⇥ v) d⌦.
(9.45)
9.8 Variables polares–nodales
Teniendo en cuenta las expresiones dadas en (9.19) podremos poner
X · dx = (ṙu+
G
r
v)(u dr + r du).
Variables polares–nodales 159
Después de sustituir du por su valor (9.45), poniendo (! + f) en lugar de ✓, y
tras aplicar las propiedades de ortogonalidad entre u,v y n, aśı como su relación
con e
3
, y desarrollar, se obtendrá finalmente
X · dx = ṙdr +Gd(! + f) +G(e
3
· n)d⌦. (9.46)
Si definimos ahora un conjunto de seis variables por medio de las siguientes
igualdades:
r , ✓ = ! + f , ⌫ = ⌦,
R = ṙ , ⇥ = G , N = G (e
3
· n) = G cos i,
(9.47)
la igualdad (9.46), expresada en estas variables, podrá ponerse como
X · dx = Rdr +Gd✓ +Nd⌫, (9.48)
lo que demuestra que la transformación de (x,X) a (r, ✓, ⌫, R,⇥, N) es comple-
tamente canónica.
G
⇥ = G
N = G cos i = H
n
e
3
e
1
e
2
⌫ = ⌦ = h
✓
l
x
r
i
Figura 9.10: Coordenadas polares-nodales.
Al conjunto de variables canóni-
cas (r, ✓, ⌫, R,⇥, N) se le llama varia-
bles polares–nodales y también varia-
bles de Hill o variables de Whittaker.
Nótese que N representa la proyec-
ción del momento angular sobre el eje
Oz. El significado del resto de las va-
riables es evidente de acuerdo con la
definición.
Al ser las variables polares–
nodales un conjunto de variables
canónicas, el hamiltoniano del proble-
ma kepleriano se obtendrá aplicando
directamente la transformación. Para
ello recordemos que la velocidad pue-
de expresarse como
v2 = ṙ2 + r2ḟ2 = R2 +
⇥2
r2
,
por lo que la función de Hamilton del problema kepleriano se expresará en la
forma
H
k
=
1
2
(R2 +
⇥2
r2
)� µ
r
. (9.49)
160 Órbitas keplerianas
9.9 Variables de Delaunay en el movimiento eĺıpti-
co
A partir de las variables polares–nodales obtendremos otro conjunto de va-
riables muy útiles en el estudio de las perturbaciones orbitales: las variables de
Delaunay. En esta sección introduciremos estas variables en su forma clásica, esto
es, definidas únicamente para el movimiento eĺıptico, sin embargo, su extensión a
los otros tipos de movimientos puede ser efectuada sin grandes dificultades. Deno-
taremos las nuevas variables como (`, g, h, L,G,H), siendoH = N, h = ⌫, es decir,
con el último momento y variable iguales a los de las variables polares–nodales.
Para obtener la transformación haremos uso de la ecuación de Hamilton–
Jacobi que nos permite obtener una transformación canónica a partir de la ecua-
ción en derivadas parciales obtenida de sustituir, en el hamiltoniano, los momentos
por las derivadas de la función generatriz respecto de las variables.
Teniendo en cuenta la expresión (9.49), igualando ésta a la enerǵıa, que en el
caso eĺıptico4 se puede poner como �µ/2a, y después de sustituir los momentos
por las derivadas de la función generatriz S respecto de las variables, llegaremos
a la ecuación de Hamilton–Jacobi
1
2
"
✓
@S
@r
◆
2
+
✓
@S
@✓
◆
2 1
r2
#
� µ
r
= � µ
2a
. (9.50)
La solución de esta ecuación podrá ser obtenida ensayando una expresión de
S separada en las variables r y ✓, esto es con S = S
1
(r) + S
2
(✓), en cuyo caso
tendremos
1
2
@S
1
@r
◆
2
+
✓
@S
2
@✓
◆
2 1
r2
#
� µ
r
= � µ
2a
,
que puede también ponerse como
✓
@S
2
@✓
◆
2
= 2µr � µr2
a
� r2
✓
@S
1
@r
◆
2
= P 2
2
,
donde P
2
debe ser constante pues iguala una función que depende exclusivamente
de ✓ con otra que solo depende de r. Aśı pues, podremos poner por un lado
S
2
(✓) = P
2
✓,
y por otro
@S
1
@r
=
1
r
r
2µr � µr2
a
� P 2
2
,
4Esta restricción hace que las variables que se definen aqúı sean válidas únicamente para el
caso eĺıptico.
Variables de Delaunay en el movimiento eĺıptico 161
lo que permite expresar S como
S = P
2
✓ �
Z
r
r0
r
2µ
r
� µ
a
� P 2
2r2
, (9.51)
donde el ĺımite inferior de integración r
0
será elegido posteriormente.
De acuerdo con la teoŕıa de Hamilton–Jacobi una función generatriz S(q,P )
define una transformación canónica (q,p)! (Q,P ) a través de las ecuaciones:
p =
@S
@q
, Q =
@S
@P
.
En nuestro caso tomaremos como variables y momentos viejos las variables polares–
nodales, q
1
= r, q
2
= ✓, p
1
= R, p
2
= ⇥, de donde llegaremos a las relaciones:
ṙ = R = p
1
=
@S
@q
1
=
@S
@r
=
r
2µ
r
� µ
a
� P 2
2
r2
,
⇥ = G = p
2
==
@S
@q
1
=
@S
@✓
= P
2
.
(9.52)
Elegiremos como nuevos momentos (P
1
=
p
µa, P
2
). El segundo coincide con
⇥ o, lo que es igual, con la norma del momento angular G, por ello se utiliza esta
última notación en el contexto de las variables de Delaunay, P
2
= G. Respecto a
P
1
, suele usarse la letra L, esto es P
1
= L. De esta forma, las nuevas coordenadas
serán:
Q
1
=
@S
@P
1
=
Z
r
r0
2µ2P�3
1
2
s
2µ
r
� µ2
P 2
1
� P 2
2
r2
dr,
Q
2
=
@S
@P
2
= ✓ +
Z
r
r0
2P
2
2r2
s
2µ
r
� µ2
P 2
1
� P 2
2
r2
dr,
donde, teniendo en cuenta las relaciones (9.52) además de los valores de P
1
, P
2
, y
por otro lado las relaciones dr = ṙdt, df = Gdt/r2 y la definición del movimiento
medio en el caso eĺıptico n =
p
µ/a3, se llega a:
Q
1
=
Z
r
r0
r
µ
a3
1
ṙ
dr =
Z
t
t0
ndt,
Q
2
= ✓ +
Z
r
r0
G
r2ṙ
dr = ✓ +
Z
f
f0
df.
Estas expresiones nos permiten elegir el ĺımite inferior de integración como el
periastro de la órbita, por lo que r
0
= r
p
, t
0
= T, f
0
= 0, lo que, junto con la
162 Órbitas keplerianas
relación ✓ = ! + f , nos lleva a las expresiones
Q
1
= n(t� T ) = `,
Q
2
= ! = g,
(9.53)
donde hemos sustituido la notación de ! por g para emplear la notación clásica
de las variables de Delaunay.
Todo lo anterior nos permite definir el conjunto de variables de Delaunay
(`, g, h, L,G,H) como el conjunto de variables obtenidas a partir de las relaciones:
` = n(t� T ) , g = ! , h = ⌦,
L =
p
µa , G , H = G cos i.
(9.54)
Finalmente, puesto que el hamiltoniano del movimiento kepleriano coincide
con la enerǵıa, y ésta en el caso eĺıptico vale �µ/2a, podremos expresar la función
de Hamilton en variables de Delaunay como
H
k
= � µ2
2L2
. (9.55)
Caṕıtulo 10
Formulación universal del
problema kepleriano
10.1 Introducción
La distinta formulación de los tres tipos de movimiento resulta poco práctica
para el estudio de movimientos orbitales perturbados en las proximidades de un
movimiento parabólico, donde cualquier perturbación puede producir una transi-
ción entre movimientos periódicos y no periódicos o viceversa. En este apartado
describiremos una nueva formulación universal, esto es, válida para los tres ti-
pos de movimientos simultáneamente, que está basada en el uso de la variable s,
definida en (8.15), como variable independiente y de las funciones de Stump↵.
10.2 Funciones V de Stump↵
Llamaremos funciones de Stump↵ al conjunto de funciones de variable com-
pleja definidas como
c
n
(z) =
X
k�0
(�1)k zk
(2k + n)!
, n = 0, 1, 2, . . . (10.1)
Dado que estas series de potencias son absolutamente convergentes en todo el
plano complejo, las funciones c
n
(z) están definidas para cada valor de z. Cuando
z toma valores reales, las funciones c
n
(z) serán reales.
164 Formulación universal del problema kepleriano
Llamaremos funciones V de Stump↵ al conjunto de funciones definidas a partir
de las de Stump↵ como
V
n
(x;↵) = xnc
n
(↵x2) =
X
k�0
(�1)k
(2k + n)!
↵kx2k+n, n = 0, 1, 2, . . . , (10.2)
donde x 2 IR es la variable y ↵ 2 IR un parámetro.
De acuerdo con la definición (10.1) las funciones c
0
, c
1
pueden identificarse con
las funciones elementales siguientes:
c
0
(x) =
8
<
:
cos
p
x si x > 0,
1 si x = 0,
cosh
p
�x si x < 0,
c
1
(x) =
8
>
>
>
>
>
<
>
>
>
>
>
:
sen
p
xp
x
si x > 0,
1 si x = 0,
senh
p
�xp
�x si x < 0.
(10.3)
De aqúı pueden deducirse fácilmente las relaciones:
V
0
(x;↵) =
8
<
:
cos(
p
↵x) si ↵ > 0,
1 si ↵ = 0,
cosh(
p
�↵x) si ↵ < 0,
V
1
(x;↵) =
8
>
>
>
>
>
<
>
>
>
>
>
:
sen(
p
↵x)p
↵
si ↵ > 0,
x si ↵ = 0,
senh(
p
�↵x)p
�↵ si ↵ < 0.
(10.4)
Asimismo puede verse, a partir de la definición, que se verifican las siguientes
igualdades:
V
n
(�x;↵) = V
n
(x;↵),
V
0
(0,↵) = 1,
V
n
(0,↵) = 0, n � 1.
(10.5)
Propiedad.- La relación entre dos funciones V
n
y V
n+2p
viene dada por la fórmula
V
n
(x;↵)� xn
p�1
X
k=0
(�↵)kx2k
(2k + n)!
= (�↵)p V
n+2p
(x;↵). (10.6)
Funciones V de Stump↵ 165
La propiedad puede demostrarse sin más que tener en cuenta que V
n
puede
ponerse también como
V
n
(x;↵) = xn
X
k�0
(�↵)kx2k
(2k + n)!
,
de donde el término de la izquierda de (10.6) se obtiene restando los p primeros
términos de V
n
, con lo que llegamos a
xn
X
k�p
(�↵)kx2k
(2k + n)!
.
Una simple reestructuración de ı́ndices, definiendo m = k � p, permite expresar
dicho término como
xn
X
m�0
(�↵)m+px2m+2p
(2m+ 2p+ n)!
= (�↵)pxn+2p
X
m�0
(�↵)mx2m
(2m+ n)!
= (�↵)p V
n+2p
(x;↵),
con lo que queda demostrada la propiedad.
Particularizando (10.6) para p = 1 se obtiene una relación que será muy usada
V
n
(x;↵) + ↵V
n+2
(x;↵) =
xn
n!
. (10.7)
Esta expresión nos da un procedimiento recursivo que permite evaluar V
n
para
cualquier valor de x y ↵ 6= 0, siempre que podamos evaluar V
0
y V
1
, lo que resulta
sencillo a partir de las expresiones (10.4). Cuando ↵ = 0, basta particularizar la
definición (10.2) con lo que se obtiene
V
n
(x; 0) =
xn
n!
. (10.8)
Este no será el mejor método de evaluación de las funciones V de Stump↵, sin
embargo, es un procedimiento sencillo que puede implementarse fácilmente en un
ordenador y que puede hacer manejables y prácticas estas funciones.
Propiedad.- La familia de funciones V de Stump↵ es cerrada respecto a la dife-
renciación e integración, es decir:
@ V
n
(x;↵)
@x
= V
n�1
(x;↵), n � 1,
@ V
0
(x;↵)
@x
= �↵V
1
(x;↵),
Z
x
0
V
n
(s;↵)d s = V
n+1
(x;↵).
(10.9)
Para demostrar esta propiedad basta aplicar la derivación e integración, término
a término, en la serie que define estas funciones.
166 Formulación universal del problema kepleriano
Propiedad.- La familia de funciones V de Stump↵ verifica las relaciones:
@m V
n
(x;↵)
@xm
=
8
>
<
>
:
V
n�m
si n � m,
@m�n V
0
(x;↵)
@xm�n
si n < m.
@m V
0
(x;↵)
@xm
=
(
(�↵)m
2 V
0
(x;↵) si m es par,
(�↵)m+1
2 V
1
(x;↵) si m es impar.
(10.10)
La relación anterior se demuestra, por simple comprobación, a partir de la
proposición anterior.
Propiedad.- Las derivadas de las funciones V respecto al parámetro vienen dadas
por las expresiones
@ V
n
(x;↵)
@↵
=
1
2
[nV
n+2
(x;↵)� xV
n+1
(x;↵)] . (10.11)
En efecto, derivando en la definición (10.2) se tiene
@ V
n
(x;↵)
@↵
=
X
k�1
(�1)pp↵p�1x2p+n
(2p+ n)!
=
�1
2
X
m�0
(�1)m2(m+ 1)↵mx2m+2+n
(2m+ 2 + n)!
.
Por último basta tener en cuenta que
2m+ 2
(2m+ 2 + n)!
=
2m+ 2 + n� n
(2m+ 2 + n)!
=
1
(2m+ 1 + n)!
� n
(2m+ 2 + n)!
,
para demostrar la proposición enunciada.
Propiedad.- Las n + 1 primeras funciones V
n
(x;↵) constituyen un sistema de
funciones linealmente independientes para cualquier valor de n.
Para comprobar que n + 1 funciones x
0
, x
1
, . . . , x
n
son linealmente indepen-
dientes, es preciso comprobar que el wronskiano es distinto de cero, esto es
w(x
0
, x
1
, . . . , x
n
) =
�
�
�
�
�
�
�
�
x
0
x
1
x
2
. . . x
n
x0
0
x0
1
x0
2
. . . x0
n
. . .
x(n)
0
x(n)
1
x(n)
2
. . . x(n)
n
�
�
�
�
�
�
�
�
6= 0.
En nuestro caso, el wronskiano se obtiene a partir de la expresión de las deri-
vadas n-simas de las funciones. Comprobaremos únicamente el caso n = 3, para
cualquier otro n el procedimiento será idéntico.
w(V
0
,V
1
,V
2
,V
3
, ) =
�
�
�
�
�
�
�
�
V
0
V
1
V
2
V
3
�↵V
1
V
0
V
1
V
2
�↵V
0
�↵V
1
V
0
V
1
↵2 V
1
�↵V
0
�↵V
1
V
0
�
�
�
��
�
�
�
.
Funciones V de Stump↵ 167
Multiplicando la primera y segunda filas por ↵ y sumándosela a la tercera y
cuarta respectivamente se obtiene, después de aplicar la relación (10.7),
w(V
0
,V
1
,V
2
,V
3
) =
�
�
�
�
�
�
�
�
V
0
V
1
V
2
V
3
�↵V
1
V
0
V
1
V
2
0 0 1 x
0 0 0 1
�
�
�
�
�
�
�
�
= V2
0
+↵V2 .
Observando las derivadas de V
0
y V
1
respecto a x obtenemos que
V
0
V 0
0
+↵V
1
V 0
1
= 0,
por lo que podemos poner
V2
0
+↵V2
1
= constante,
basta tener en cuenta los valores de V
0
y V
1
en x = 0 para deducir que
V2
0
(x;↵) + ↵V2
1
(x;↵) = 1,
y por tanto
w(V
0
,V
1
,V
2
,V
3
) = 1,
con lo que queda demostrada la proposición.
Propiedad.- V
n
(x;↵) es solución de la ecuación diferencial lineal homogénea
dm+2y
dxm+2
+ ↵
dmy
dxm
= 0,
para todo n m+ 1.
Para demostrar esto basta tener en cuenta la expresión de las derivadas n-
simas y (10.7).
Propiedad.- Dado un número real arbitrario ↵, la función
y(x;↵) =
m+1
X
k=0
�
k
V
k
(x;↵), (10.12)
es la solución general de la ecuación diferencial
dm+2y
dxm+2
+ ↵
dmy
dxm
= 0, m � 0. (10.13)
La demostración es trivial pues cada una de las las m + 2 funciones V
k
es,
según la proposición anterior, solución de la ecuación y éstas son linealmente
independientes.
168 Formulación universal del problema kepleriano
10.3 Funciones V0,V1
Las funciones V
0
,V
1
constituyen la extensión natural de las funciones cos, cosh
por un lado y sen, senh por otro. Además, cualquier otra función V
n
puede ex-
presarse en términos de las dos primeras, por lo que éstas juegan un importante
papel en Astrodinámica.
Ya hemos visto como la propiedad fundamental de las funciones circulares
puede extenderse a las de Stump↵ por medio de la igualdad (10.7), particularizada
para n = 0 en la forma:
V2
0
(x;↵) + ↵V2
1
(x;↵) = 1. (10.14)
Por otro lado, puede demostrarse fácilmente la extensión de las propiedades
de adición y ángulo doble de las funciones circulares, obteniendose:
V
0
(x± y;↵) = V
0
(x;↵)V
0
(y;↵)⌥ ↵V
1
(x;↵)V
1
(y;↵), (10.15)
V
1
(x± y;↵) = V
1
(x;↵)V
0
(y;↵)± V
0
(x;↵)V
1
(y;↵), (10.16)
V
0
(2x;↵) = V2
0
(x;↵)� ↵V2
1
(x;↵) = (10.17)
= 2V2
0
(x;↵)� 1 = 1� 2↵V2
1
(x;↵),
V
1
(2x;↵) = 2V
0
(x;↵)V
1
(x;↵). (10.18)
De la misma forma que el cociente de funciones circulares e hiperbólicas da
lugar a la función tangente y tangente hiperbólica, podemos introducir la función
V
t
(x;↵) =
V
1
(x;↵)
V
0
(x;↵)
. (10.19)
Finalmente, considerando la definición de las funciones inversas de las circula-
res e hiperbólicas podemos definir las inversas de las de Stump↵, una vez fijado ↵
y estudiado el rango de definición de éstas que coincide con el de sus homólogas
circulares e hiperbólicas.
V�1
0
(x;↵) =
8
>
<
>
:
acosxp
↵
si ↵ > 0,
acoshxp
�↵ si ↵ < 0,
(10.20)
V�1
1
(x;↵) =
8
>
>
>
>
>
<
>
>
>
>
>
:
asen(
p
↵x)p
↵
si ↵ > 0,
x si ↵ = 0,
asenh(
p
�↵x)p
�↵ si ↵ < 0,
(10.21)
Formulación universal del problema kepleriano 169
V�1
t
(x;↵) =
8
>
>
>
>
>
<
>
>
>
>
>
:
atan(
p
↵x)p
↵
si ↵ > 0,
x si ↵ = 0,
atanh(
p
�↵x)p
�↵ si ↵ < 0.
(10.22)
10.4 Formulación universal del problema keple-
riano
Para obtener expresiones del problema kepleriano válidas para cualquier tipo
de movimiento volveremos a la ecuación (8.21) que, después de derivar respecto
a s, se transforma en
r000 � 2hr0 = 0. (10.23)
De acuerdo con las propiedades de las funciones de Stump↵, vistas en 10.2, una
solución general de la ecuación homogénea (10.23) podrá expresarse como
r(s) = �
0
V
0
(s,�2h) + �
1
V
1
(s,�2h) + �
2
V
2
(s,�2h), (10.24)
donde �
0
,�
1
,�
2
son tres constantes de integración.
Todas las ecuaciones diferenciales que aparecerán en esta sección tendrán el
mismo parámetro ↵ = �2h por lo que en todas las ocasiones llegaremos a fun-
ciones de la forma V
n
(s,�2h). Teniendo en cuenta que h es un constante del
movimiento, no existirá ambigüedad si en la notación suprimimos el argumento
�2h y escribimos V
n
(s). Cuando no exista tampoco ambigüedad en la variable
temporal s podremos también poner, por brevedad V
n
.
Derivando dos veces la expresión (10.24) y teniendo en cuenta los valores
particulares de V
n
(0), se tendrá:
r(s = 0) = r
0
= �
0
,
r0(s = 0) = r0
0
= �
1
,
r00(s = 0) = r00
0
= 2h�
0
+ �
2
,
donde, para generalizar, se ha considerado el cero de s en un instante t
0
que, por
ahora, no tiene que coincidir con T . Aplicando la relación (8.21) para obtener r00
0
en función de r
0
, r0
0
, se podrá poner finalmente
r(s) = r
0
V
0
(s) + r0
0
V
1
(s) + µV
2
(s). (10.25)
Por otro lado, integrando la ecuación (8.19) con el valor de r dado por (10.25), se
obtiene finalmente
t� t
0
= r
0
V
1
(s) + r0
0
V
2
(s) + µV
3
(s), (10.26)
170 Formulación universal del problema kepleriano
que será llamada ecuación de Kepler universal, pues, al igual que (10.25), es válida
para cualquier tipo de movimiento.
Finalmente, si derivamos respecto a s la expresión
x
0 = r ẋ,
obtendremos
x
00 = r0 ẋ+ r2 ẍ = r0 ẋ� µ
r
x,
o lo que es igual
rx00 = r0x0 � µx. (10.27)
Derivando nuevamente y aplicando la relación (8.21) se llega fácilmente a
x
000 � 2hx0 = 0,
cuya solución se podrá poner como
x = �
0
V
0
+�
1
V
1
+�
2
V
2
,
donde ahora �
0
,�
1
,�
2
representan tres vectores constantes cuyos valores, después
de derivar, igualar a cero y expresar x
00
0
en función de x
0
,x0
0
de acuerdo con
(10.27), pueden expresarse como
�
0
= x
0
, �
1
= x
0
0
, �
2
=
r0
0
r
0
x
0
0
�
✓
µ
r
0
+ 2h
◆
x
0
.
Por tanto, x(s) será igual a
x(s) =
V
0
�
✓
µ
r
0
+ 2h
◆
V
2
�
x
0
+
V
1
+
r0
0
r
0
V
2
�
x
0
0
,
relación que, tras aplicar la propiedad V
0
�2hV
2
= 1, adopta la forma
x(s) =
1� µ
r
0
V
2
�
x
0
+
V
1
+
r0
0
r
0
V
2
�
x
0
0
. (10.28)
En este apartado hemos supuesto el instante inicial t
0
distinto, en principio, de
T , por tanto, las fórmulas son válidas para cualquier instante inicial. Sin embargo,
cuando t
0
= T tendremos
r0
0
= r0
p
= 0, r
0
= r
p
=
p
1 + e
,
con lo que las expresiones anteriores se simplificarán, obteniendose las relaciones:
r = r
p
V
0
(s) + µV
2
(s),
t� T = r
p
V
1
(s) + µV
3
(s),
x =
1� µ
r
p
V
2
(s)
�
x
p
+ V
1
(s)x0
p
.
(10.29)
Formulación universal del problema kepleriano 171
Las dos primeras expresiones pueden simplificarse más teniendo en cuenta las
relaciones
V
0
�2hV
2
= 1,
V
1
�2hV
3
= s,
µ+ 2hr
p
= µe,
(10.30)
esta última puede obtenerse sin más que tener en cuenta
h =
A2 � µ2
2G2
=
µ2e2 � µ2
2µp
=
µ(e2 � 1)
2p
, r
p
=
p
1 + e
.
Sustituyendo (10.30) en (10.29) se obtiene por un lado:
r = r
p
+ µeV
2
(s),
t� T = r
p
s+ µeV
3
(s),
(10.31)
y por otro:
r = � µ
2h
[1� eV
0
(s)],
t� T = � µ
2h
[s� eV
1
(s)],
(10.32)
ecuaciones similares a las dadas para cada uno de los movimientos eĺıptico e
hiperbólico pero que no son válidas para el cálculo en el caso parabólico, por lo
que dejan de ser universales.
Si atendemos a la definición de los vectores a, b, del sistema apsidal, podemos
poner
x
p
= r
p
a, X
p
= v
p
b,
donde v
p
representa la velocidad en el periastro, por lo que
x
0
p
= r
p
X
p
= r
p
v
p
b.
La relación anterior puede modificarse si tenemos en cuenta que, por un lado
G =
p
µp y además
G = x⇥X = x
p
⇥X
p
,
luego se tendrá finalmente
r
p
v
p
= r
p
v
p
sen 90� = x
p
X
p
sen(x
p
,X
p
) = G =
p
µp.
Reuniendo las anteriores relaciones y llevándolas a la tercera ecuación (10.29)
se llega finalmente a
x = [r
p
� µV
2
(s)]a+
p
µpV
1
(s) b, (10.33)
que comparada con (9.17) permite poner
r cos f = r
p
� µV
2
(s), r sen f =
p
µpV
1
(s). (10.34)
172 Formulación universal del problema kepleriano
Teniendo en cuenta las expresiones de r, r cos f y las relaciones(10.30) obtendre-
mos fácilmente las expresiones
2 r cos2
f
2
= r + r cos f = r
p
[1 + V
0
(s)],
2 r sen2
f
2
= r � r cos f, = µ(1 + e)V
2
(s) = �µ(1 + e)
2h
[1� V
0
(s)].
Por último, las expresiones (10.17) conducen a
p
r cos
f
2
=
p
r
p
V
0
(
s
2
),
p
r sen
f
2
=
p
µ(1 + e)V
1
(
s
2
), (10.35)
que divididas nos dan
tan
f
2
=
r
µ
p
(1 + e)V
t
(
s
2
). (10.36)
10.5 Coeficientes de transición en forma cerrada
Las propiedades del movimiento kepleriano permiten expresar las funciones f ,
g en forma cerrada, esto es, sin los desarrollos en serie de las expresiones (7.39),
aunque en dichas expresiones no aparecerá t expĺıcitamente.
El valor de f y g se obtiene fácilmente si tenemos en cuenta la relación (10.28)
x(s) =
1� µ
r
0
V
2
(s)
�
x
0
+ [r
0
V
1
(s) + r0
0
V
2
(s)]X
0
,
donde hemos tenido en cuenta que x
0
0
= r
0
X
0
. Por tanto, podremos poner por
un lado
f(t; t
0
) = 1� µ
r
0
V
2
(s), (10.37)
y por otro
g(t; t
0
) = r
0
V
1
(s) + r0
0
V
2
(s).
Finalmente, si tenemos también en cuenta (10.26) llegamos a la igualdad
g(t; t
0
) = (t� t
0
)� µV
3
(s). (10.38)
Las expresiones (10.37) y (10.38) nos dan el valor de f y g en forma cerrada
en función de s.
Las derivadas de f y g respecto a t serán
@f
@t
=
µ
rr
0
V
1
(s),
@g
@t
= 1� µ
r
V
2
(s).
Coeficientes de transición en forma cerrada 173
Recordando que �µV
2
= r
0
(1� f) se llega a
@g
@t
= 1� r
0
r
[1� f(t; t
0
)] . (10.39)
Por otro lado, la relación (10.26) puede ponerse como
V
1
=
1
r
0
[(t� t
0
)� r0
0
V
2
�µV
3
] =
1
r
0
[g(t; t
0
)� r0
0
V
2
]
=
1
r
0
g(t; t
0
) +
r
0
r0
0
µ
(1� f)
�
,
lo que permite poner
@f
@t
=
r
0
S
0
r
[1� f(t; t
0
)]� r
0
R
0
r
g(t; t
0
), (10.40)
con lo que se completa la relación de fórmulas necesarias para el cálculo de efeméri-
des.
Por su importancia veremos en que se transforman las expresiones (10.37) y
(10.38) en el movimiento eĺıptico, para el cual 2h < 0 y por tanto:
�2hV
2
(s,�2h) = 1� V
0
(s,�2h) = 1� cos
p
�2hs,
�2hV
3
(s,�2h) = s� V
1
(s,�2h) = s� sen
p
�2hsp
�2h
,
para llegar finalmente a:
f(t; t
0
) = 1 +
µ
2hr
0
⇣
1� cos
p
�2hs
⌘
,
g(t; t
0
) = (t� t
0
) +
µ
2h
p
�2hs� sen
p
�2hsp
�2h
.
Al integrar en forma separada el movimiento eĺıptico hab́ıamos definido la ano-
maĺıa media como E =
p
�2hs, después de suponer que el instante t
0
coincid́ıa
con la época de paso por el periastro, esto es t
0
= T,E = 0. Sin embargo, para
encontrar la expresión de f(t; t
0
), g(t; t
0
), válida para cualquier t
0
es preciso supo-
ner que t
0
puede ser cualquier instante, para lo cual tomaremos E�E
0
=
p
�2hs,
y de ah́ı:
f(t; t
0
) = 1� µ
�2hr
0
[1� cos(E � E
0
)] ,
g(t; t
0
) = (t� t
0
) +
µ
(�2h)(3/2) [(E � E
0
)� sen(E � E
0
)] .
Finalmente, si tenemos en cuenta que el movimiento es eĺıptico tendremos que
�2h = µ/a = n2a3/a = n2a2, que llevado a las igualdades anteriores nos da:
f(t; t
0
) = 1� a
r
0
[1� cos(E � E
0
)] ,
g(t; t
0
) = (t� t
0
) +
1
n
[(E � E
0
)� sen(E � E
0
)] .
(10.41)
174 Formulación universal del problema kepleriano
Caṕıtulo 11
Órbitas keplerianas que
pasan por dos puntos
11.1 Problema de transferencias orbitales y pro-
blema de Lambert
Plantearemos ahora una una importante pregunta de la dinámica orbital:
¿qué órbita u órbitas permiten llegar a un cuerpo en el espacio desde una po-
sición inicial P
1
a otra final P
2
? Esta pregunta conduce a dos problemas distintos
según que impongamos o no el tiempo de tránsito entre las dos posiciones.
El problema de las transferencias orbitales busca el conjunto O(P
1
, P
2
) de
todas las órbitas keplerianas que pasan por los dos puntos. A cada una de las
infinitas soluciones de este problema se le denomina órbita de transferencia y su
conocimiento es de gran aplicación en tecnoloǵıa espacial para estudiar el proble-
ma de la conexión de dos puntos en el espacio a través de un satélite artificial o
sonda espacial.
Si entre todas las órbitas de transferencia que conectan dos puntos buscamos
aquellas que tardan un tiempo dado en pasar de un punto a otro, nos encontramos
con un problema clásico de la Mecánica Celeste llamado problema de Lambert.
Aśı como el problema de las transferencias tiene infinitas soluciones, el problema
de Lambert tiene una única solución. El problema de Lambert va asociado al
problema de determinación de una órbita cuando tenemos información parcial de
la misma en varios instantes diferentes, lo que ocurre, por ejemplo, en el caso de
cometas, asteroides, etc.
176 Órbitas keplerianas que pasan por dos puntos
En este caṕıtulo abordamos ambos problemas. En primer lugar buscaremos,
y caracterizaremos en función de su enerǵıa, todas las órbitas que pasan por dos
puntos diferentes. Posteriormente encontraremos la relación de la enerǵıa de la
órbita con el tiempo de tránsito entre los puntos P
1
y P
2
y de esta forma en-
contraremos un método de resolución del problema de Lambert. Los métodos
habitualmente desarrollados en la literatura cient́ıfica para la resolución del pro-
blema de Lambert son distintos al presentado en este libro. No pretendemos con
esto dar ningún método alternativo, de hecho, este método no es comparable con
otros ni en precisión ni en velocidad, sin embargo, nos ha parecido útil su inclusión
en el libro pues conecta, de manera más natural, la resolución de ambos problemas
y es más claro desde el punto de vista didáctico.
11.2 Órbitas de transferencia
e
1
e
2
e
3
n
d
l
d
O
d
P
1
P
2
⌦
d
i
d
n
r
l
r
O
r
Figura 11.1: Órbitas de transferencia direc-
ta, O
d
, y retrógrada, O
r
.
Sean dos puntos P
1
, P
2
, que en el
sistema espacial S, con origen O en
el cuerpo central, pueden represen-
tarse a través de los vectores x
1
=
OP
1
, x
2
= OP
2
, que supondremos
no colineales. Supongamos que existe
una cónica que pasa por P
1
y P
2
y tie-
ne el punto O como foco. Esta cónica
puede dar lugar a dos órbitas kepleria-
nas, una directa O
d
y otra retrógrada
O
r
, según que, visto desde la direc-
ción de e
3
, el orbitador vaya de P
1
a
P
2
en el sentido directo o retrógrado
respectivamente (figura 11.1). Ambas
órbitas tienen en común el plano or-
bital y su sistema nodal se caracteriza por unos vectores l,n cuya relación entre
si es l
d
= �l
r
,n
d
= �n
r
.
Para buscar todas las órbitas keplerianas que pasan por P
1
y P
2
buscaremos
por separado las órbitas directas y las retrogradas, duplicandose, de esta forma,
el conjunto de soluciones encontradas. Llamemos n
p
= (x
1
⇥ x
2
)/kx
1
⇥ x
2
k,
y supongamos que n
p
· e
3
� 0. Si queremos órbitas directas partiremos de un
valor n = n
d
= n
p
, mientras que si queremos órbitas retrógradas tomaremos
n = n
r
= �n
p
. Cuando n
p
· e
3
< 0, tomaremos n = n
d
= �n
p
para órbitas
directas y n = n
r
= n
p
para órbitas retrogradas.
Elementos del triángulo OP
1
P
2
177
11.2.1 Plano de la órbita
Fijado n podemos obtener el sistema orbital en el punto P
1
y el P
2
a través
de las expresiones:
u
1
=
x
1
r
1
, n, v
1
= n⇥ u
1
,
u
2
=
x
2
r
2
, n, v
2
= n⇥ u
2
.
(11.1)
El valor del vector n determinará, sin ambigüedad, el plano del movimiento a
través de los elementos ⌦, i dados por medio de las expresiones (9.24). Además,
una vez obtenidos éstos, podemos calcular los vectores l,m del sistema de refe-
rencia nodal. En particular tendremos
l = cos⌦ e
1
+ sen⌦e
2
. (11.2)
11.2.2 Ángulo de transferencia
Hemos dicho anteriormente que una órbita kepleriana, vista desde el vector
n, siempre es directa, puesto que las anomaĺıas son siempre crecientes. Dicho
ésto, y una vez fijado n tras decidir si queremos una órbita directa o retrógrada,
llamaremos ángulo de transferencia al ángulo directo, con la orientación dada por
n, que lleva el vector x
1
al x
2
. Este ángulo,que puede tomar cualquier valor entre
0 y 2⇡, viene determinado uńıvocamente por la expresión (1.25), esto es
w = atan (x
1
· x
2
, n · (x
1
⇥ x
2
)) , w 2 [0, 2⇡).
El ángulo de transferencia puede ponerse también como:
r
1
r
2
cosw = x
1
· x
2
,
r
1
r
2
senw = n · (x
1
⇥ x
2
).
(11.3)
11.3 Elementos del triángulo OP1P2
O P
1
P
2
w
t
�
1
�
2
r
1
r
2
c
Figura 11.2: Triángulo OP1P2.
El triángulo OP
1
P
2
de la figura
11.2, juega un importante papel en el
estudio de las transferencias orbitales.
El ángulo w
t
, con vértice en O, coincide
con el ángulo de transferencia w cuan-
do éste es menor que ⇡ y con 2⇡ � w
cuando es mayor que ⇡. En cualquier
caso se tendrá cosw
t
= cosw. Además,
la cuerda c subtendida por los dos pun-
tos P
1
y P
2
se obtendrá con la relación
c2 = x
2
12
= (x
2
� x
1
)2 = r2
1
+ r2
2
�
2r
1
r
2
cosw
t
= r2
1
+ r2
2
� 2r
1
r
2
cosw,
mientras que el semipeŕımetro valdrá � = (r
1
+ r
2
+ c)/2.
178 Órbitas keplerianas que pasan por dos puntos
Teniendo en cuenta el valor de c2 podremos poner
(r
1
+ r
2
+ c)(r
1
+ r
2
� c) = 2r
1
r
2
(1 + cosw) = 4r
1
r
2
cos2
w
2
,
(r
1
+ c� r
2
)(r
2
+ c� r
1
) = 2r
1
r
2
(1� cosw) = 4r
1
r
2
sen2
w
2
.
Por otro lado
(r
1
+ r
2
� c) = 2(�� c),
(r
1
+ c� r
2
) = 2(�� r
2
),
(r
2
+ c� r
1
) = 2(�� r
1
),
lo que conduce a las expresiones:
r
1
r
2
cos2
w
2
= �(�� c),
r
1
r
2
sen2
w
2
= (�� r
1
)(�� r
2
).
Si extraemos la ráız cuadrada y tenemos en cuenta los signos del seno y coseno
de w/2, según el cuadrante de w, podremos poner
cos
w
2
= �
w
s
�(�� c)
r
1
r
2
, sen
w
2
=
s
(�� r
1
)(�� r
2
)
r
1
r
2
, (11.4)
donde hemos llamado
�
w
=
⇢
1 si w < ⇡,
�1 si w > ⇡.
(11.5)
Definiremos los ángulos exteriores �
1
,�
2
como los ángulos que llevan respec-
tivamente de x
1
a x
12
y de x
12
a �x
2
en sentido positivo desde la orientación
dada por n.
Si tenemos en cuenta la expresión (1.24) del seno y coseno del ángulo orientado
entre dos vectores y la definición de �
1
, podremos poner
c r
1
cos�
1
= x
1
· x
12
= x
1
· (x
2
� x
1
) = x
1
· x
2
� r2
1
,
c r
1
sen�
1
= n · (x
1
⇥ x
12
) = n · [x
1
⇥ (x
2
� x
1
)] = n · (x
1
⇥ x
2
),
lo que, teniendo en cuenta (11.3), conduce a las relaciones
c cos�
1
= r
2
cosw � r
1
,
c sen�
1
= r
2
senw.
(11.6)
Hodógrafa en P
1
y P
2
179
Combinando convenientemente las relaciones anteriores y tras una serie de cálcu-
los, podremos poner
cos2
�
1
2
=
1
2
(1 + cos�
1
) =
(�� c)(�� r
1
)
cr
1
,
sen2
�
1
2
=
1
2
(1� cos�
1
) =
�(�� r
2
)
cr
1
.
El signo de �
1
se obtiene a partir del de w por medio de las relaciones
w < ⇡ , �
1
< ⇡, w > ⇡ , �
1
> ⇡,
que permiten analizar el signo de �
1
/2 según el cuadrante de w y poner finalmente
cos
�
1
2
= �
w
s
(�� c)(�� r
1
)
cr
1
, sen
�
1
2
=
s
�(�� r
2
)
cr
1
. (11.7)
Con un proceso similar podemos obtener también las igualdades
cos
�
2
2
= �
w
s
(�� c)(�� r
2
)
cr
2
, sen
�
2
2
=
s
�(�� r
1
)
cr
2
. (11.8)
11.4 Hodógrafa en P1 y P2
La velocidad de un punto en una órbita kepleriana puede expresarse, en el
sistema de referencia orbital, como
X = Ru+ T v, (11.9)
donde u,v representan la dirección radial y transversal y R = ṙ, T = r ḟ , siendo
f la anomaĺıa verdadera.
De las propiedades de las órbitas keplerianas podemos deducir fácilmente las
relaciones:
r =
p
1 + e cos f
, R = e
r
µ
p
sen f, T =
p
pµ
r
, (11.10)
o lo que es igual:
e cos f =
p
r
� 1, e sen f = R
r
p
µ
, p =
r2T 2
µ
. (11.11)
De acuerdo con las relaciones (11.10), los valores de R, T están restringidos a
los rangos
T > 0, �e
r
µ
p
R e
r
µ
p
. (11.12)
180 Órbitas keplerianas que pasan por dos puntos
La segunda relación no constituye realmente una restricción al valor de la
componente radial de la velocidad, sino una relación entre la velocidad y la órbita
kepleriana que ésta genera. De hecho, cualquier valor de R determina un vector
velocidad cuyos elementos orbitales verifican dicha relación.
Si f
1
, f
2
representan la anomaĺıa verdadera en cada uno de los dos puntos,
P
1
, P
2
, se tendrá que el ángulo de transferencia w es igual a
w = f
2
� f
1
. (11.13)
Si particularizamos la primera de las expresiones (11.10) para el punto P
2
(sub́ındice 2) y sustituimos f
2
por w + f
1
, nos queda una expresión en e sen f
1
,
e cos f
1
. En dicha expresión sustituiremos estos elementos por su valor en función
de R
1
y T
1
, obtenido particularizando (11.11) para P
1
. Todo este proceso nos
conduce a la relación
�
1
(R
1
, T
1
) = a
1
T 2
1
+ b
1
R
1
T
1
+ c
1
= 0, (11.14)
donde
a
1
=
r
1
� r
2
cosw
r
2
, b
1
= senw, c
1
= �µ(1� cosw)
r
1
. (11.15)
Particularizando de nuevo la primera de las ecuaciones (11.10), en este caso
en el punto P
1
, sustituyendo f
1
por w � f
2
, y por último sustituyendo sen f
2
y
cos f
2
por su valor en función de R
2
y T
2
, se obtendrá la relación
�
2
(R
2
, T
2
) = a
2
T 2
2
+ b
2
R
2
T
2
+ c
2
= 0, (11.16)
donde
a
2
=
r
2
� r
1
cosw
r
1
, b
2
= � senw, c
2
= �µ(1� cosw)
r
2
. (11.17)
La expresión �
1
(R
1
, T
1
) = 0 define la relación entre las componentes del vector
velocidad X
1
para que el punto P
2
pertenezca a la órbita O(x
1
,X
1
). Análoga-
mente �
2
(R
2
, T
2
) = 0 implica que la órbita O(x
2
,X
2
) pase por P
1
.
Finalmente, a partir de las relaciones (11.11), podemos obtener el valor dep
µp y e2 por las expresiones
p
µp = rT, e2 =
r2R2T 2
µ2
+
✓
rT
µ
� 1
◆
2
.
Una órbita kepleriana que pase por P
1
y P
2
debe tener unos valores p, e constantes
por lo que deben verificarse las relaciones
r
1
T
1
� r
2
T
2
= 0, (11.18)
r2
1
R2
1
T 2
1
µ2
+
✓
r
1
T
1
µ
� 1
◆
2
� r2
2
R2
2
T 2
2
µ2
�
✓
r
2
T
2
µ
� 1
◆
2
= 0. (11.19)
Hodógrafa en P
1
y P
2
181
Cualquiera de estas dos condiciones, (11.18 y 11.19), junto con (11.14 y 11.16),
constituyen un conjunto de tres relaciones independientes entre las componentes
R
1
, T
1
, R
2
, T
2
de la velocidad para que la órbita kepleriana pase por los dos puntos
y nos asegura que las órbitas O(x
1
,X
1
) y O(x
2
,X
2
) coinciden. Por simplicidad,
parece lógico elegir como tercera condición la expresión
�
3
(R
1
, T
1
, R
2
, T
2
) = r
1
T
1
� r
2
T
2
= 0. (11.20)
Sin embargo, cuando el ángulo de trasferencia sea w = ⇡, el valor de b
i
en las dos
primeras condiciones se hace cero, por lo que estas condiciones se transforman en
a
1
T 2
1
+ c
1
= 0, a
2
T 2
2
+ c
2
= 0,
que no forman un sistema independiente con la condición (11.20). En éste la ex-
presión de �
3
en la tercera condición, �
3
(R
1
, T
1
, R
2
, T
2
) = 0, es la parte izquierda
de (11.19).
La relación (11.14) indica cómo debe ser el vector velocidad en el punto P
1
para
que la órbita kepleriana generada pase por el punto P
2
. Esta relación representa
la ecuación de una hipérbola con dos ramas separadas por las aśıntotas T
1
= 0 y
a
1
T
1
+ b
1
R
1
= 0. La primera de las condiciones (11.12), indica que la hodógrafa
queda representada únicamente por la rama superior de la hipérbola. La figura
11.3 presenta dos de estas curvas para valores distintos de c
i
, positivo y negativo.
T
1
R
1
Figura 11.3: Hodógrafa en P1
La velocidad v
1
=
p
R2
1
+ T 2
1
,
en el punto P
1
, puede ser repre-
sentada en la gráfica 11.3 como
una semicircunferencia de radio
v
1
. Si esta semicircunferencia tie-
ne algún punto en común con la
hodógrafa los puntos de intersec-
ción señalan las velocidades en
P
1
que permiten que la órbita pa-
se por P
2
.
De acuerdo con la gráfica
existirá un valor mı́nimo de la
velocidad por debajo del cual
no hay intersección entre la
hodógrafa y la semicircunferen-
cia, lo que representa que no es posible, con esa velocidad, conectarP
1
con P
2
con una órbita kepleriana.
Por encima de esa velocidad mı́nima existirán, para cada valor de v
1
, dos
puntos de la hodógrafa, lo que representa dos órbitas keplerianas de transferencia.
Para la velocidad mı́nima existirá una única órbita kepleriana de transferencia.
182 Órbitas keplerianas que pasan por dos puntos
11.5 Órbitas de enerǵıa mı́nima
Para conocer el valor de la velocidad mı́nima que permite conectar los dos
puntos será preciso minimizar la función v2
1
= R2
1
+ T 2
1
sujeta a la condición
�
1
(R
1
, T
1
) = a
1
T 2
1
+ b
1
R
1
T
1
+ c
1
= 0. El método de los multiplicadores de La-
grange, permite obtener1 el valor
v2
m
=
2c
1
(a
1
+
p
a2
1
+ b2
1
)
b2
1
= 2µ
✓
1
r
1
� 1
�
◆
,
donde se ha expresado v
m
en términos de r
1
, r
2
y w, y posteriormente se han
aplicado las relaciones entre los lados y los ángulos del triángulo OP
1
P
2
, siendo
� el semipeŕımetro del triángulo.
Teniendo en cuenta la relación entre la velocidad en un punto y la enerǵıa de
la órbita h = v2/2 � µ/r, y aplicándola al punto P
1
con la velocidad mı́nima,
obtendremos la enerǵıa de la órbita de velocidad mı́nima
h = � µ
�
, (11.21)
que representa, por tanto, la órbita de mı́nima enerǵıa entre P
1
y P
2
. Esta enerǵıa
es negativa, por lo que la órbita correspondiente será eĺıptica, y de semieje igual
a a = �/2.
Cualquier otra órbita de O(P
1
, P
2
) tendrá una enerǵıa h > h
m
y por tanto un
semieje a > �/2.
11.6 Órbitas de enerǵıa h > hm
Igual que hemos razonado antes sobre la velocidad en la gráfica 11.3 puede
razonarse sobre la enerǵıa. A partir del valor de la enerǵıa mı́nima h
m
, cualquier
valor de la enerǵıa h, mayor que h
m
, conduce a dos órbitas keplerianas que co-
nectan los dos puntos. Estas dos órbitas se deducen a partir de los dos vectores
velocidad (R
1
, T
1
) intersección de la hodógrafa con la semicircunferencia cuyo
radio es igual a la velocidad correspondiente a la enerǵıa h.
Para obtener estos valores bastará resolver el sistema de ecuaciones
1
2
(R2
1
+ T 2
1
)� µ
r
1
� h = 0, a
1
T 2
1
+ b
1
R
1
T
1
+ c
1
= 0, (11.22)
que tendrá dos soluciones para cada valor de h > h
m
.
Una vez obtenidos los valores deR
1
y T
1
, aśı como el sistema orbital, (u
1
,v
1
,n),
en P
1
, la relación (11.9) permite obtener el vector X
1
en el sistema espacial y
1Se obtienen cuatro extremos de los que se desechan tres por dar un valor de T1 negativo o
imaginario.
Órbitas de enerǵıa h > h
m
183
con éste y x
1
, los elementos de la órbita O(x
1
,X
1
) que coincide con la órbita
de transferencia O
t
(x
1
,x
2
) de enerǵıa h. Una vez obtenida la órbita podemos
obtener fácilmente el tiempo �t que se emplea en llegar desde P
1
hasta P
2
. Este
tiempo depende de la enerǵıa h, por lo que se convierte en una función �t(h).
Para encontrar los valores R
1
, T
1
de la velocidad podemos utilizar un método
numérico que resuelva el sistema de ecuaciones no lineal (11.22). Sin embargo, la
aplicación de las funciones de Stump↵ permite encontrar anaĺıticamente estas dos
órbitas. Para ver esto efectuaremos el siguiente cambio de variable:
R
1
= x cos
�
1
2
� y sen
�
1
2
,
T
1
= x sen
�
1
2
+ y cos
�
1
2
,
mediante el cual la ecuación de la hodógrafa en P
1
se transforma en
x2 tan
�
1
2
� y2 cot
�
1
2
=
2µ
r
1
tan
w
2
, (11.23)
y la norma de la velocidad en P
1
se expresará ahora como
v2
1
= R2
1
+ T 2
1
= x2 + y2. (11.24)
El sistema de ecuaciones (11.22) se ha transformado en un sistema lineal, en
las variables x2, y2, de ecuaciones (11.23) y (11.24). Modificaremos ligeramente
este sistema sustituyendo en la última ecuación el valor de la velocidad por su
expresión en función de una enerǵıa h cualquiera, mayor que la enerǵıa mı́nima,
esto es
x2 + y2 = v2
1
=
2µ
r
1
+ 2h.
Resolviendo este sistema, después de sustituir el valor de tanw/2 por su ex-
presión en función de los elementos del triángulo OP
1
P
2
, se llega a
x2 = 2µ
�� r
1
cr
1
+ 2h
(�� c)(�� r
1
)
cr
1
,
y2 = 2µ
�� r
2
cr
1
+ 2h
�(�� r
2
)
cr
1
.
Si introducimos las cantidades auxiliares �, � por medio de las igualdades
V
1
(
�
2
;�2h) =
s
�
2µ
, � = 2V�1
1
(
r
�
2µ
;�2h),
V
1
(
�
2
;�2h) =
s
�� c
2µ
, � = 2V�1
1
(
r
�� c
2µ
;�2h),
(11.25)
184 Órbitas keplerianas que pasan por dos puntos
aśı como las constante x
p
, y
p
en la forma
x2
p
= 2µ
�� r
1
cr
1
, y2
p
= 2µ
�� r
2
cr
1
,
podremos poner
x2 = x2
p
V2
0
(
�
2
), y2 = y2
p
V2
0
(
�
2
),
donde, una vez fijado el nivel h de enerǵıa, hacemos desaparecer de las funciones
de Stump↵ el segundo parámetro.
Al estudiar la figura 11.3, en relación con la hodógrafa del movimiento en P
1
,
hemos visto como la única rama posible es aquella para la cual T
1
es positiva, lo
que equivale a considerar la rama superior. Al efectuar el giro, la rama anterior de
la hipérbola se transforma en aquella para la cual x > 0. Teniendo esto en cuenta,
podemos extraer la ráız cuadrada en las expresiones anteriores, llegándose a
x = x
p
V
0
(
�
2
), y = ±y
p
V
0
(
�
2
),
que nos da los dos posibles valores de la velocidad asociados a un nivel de enerǵıa
h > h
m
. Las dos velocidades nos indicarán que para cada nivel de enerǵıa existen
dos posibles órbitas keplerianas, que pasan por P
1
, P
2
.
Volviendo de nuevo a la expresión de la hodógrafa antes de efectuar el giro
tendremos
T
1
= x sen
�
1
2
+ y cos
�
1
2
= x
p
V
0
(
�
2
) sen
�
1
2
± y
p
V
0
(
�
2
) cos
�
1
2
,
donde sustituyendo el seno y coseno de (�
1
/2) por su valor, dado en (11.7), lle-
gamos a
T
1
=
2µ
cr
1
p
(�� r
1
)(�� r
2
)
s
�
2µ
V
0
(
�
2
)
±2µ�
w
cr
1
p
(�� r
1
)(�� r
2
)
s
�� c
2µ
V
0
(
�
2
)
=
2µ
cr
1
p
(�� r
1
)(�� r
2
)
V
0
(
�
2
)V
1
(
�
2
)± �
w
V
0
(
�
2
)V
1
(
�
2
)
�
,
y finalmente a
T
1
=
2µ
cr
1
p
(�� r
1
)(�� r
2
)V
1
✓
� ± �
w
�
2
◆
, (11.26)
que nos da los dos valores de la velocidad transversal asociados a la enerǵıa h.
Conjunto de las órbitas que pasan por dos puntos 185
Recordando la expresión p = r2T 2/µ, del semilado recto en función de la
velocidad transversal, podemos obtener el semilado recto de cada una de las dos
órbitas correspondientes a la enerǵıa h en la forma
p± = p
i
= 4µ
(�� r
2
)(�� r
1
)
c2
V2
1
✓
� ± �
w
�
2
◆
, (11.27)
donde hemos asociado el ı́ndice de p al signo correspondiente. Observemos que el
valor de p± para w coincide con el de p⌥ para 2⇡ � w, y viceversa.
11.7 Conjunto de las órbitas que pasan por dos
puntos
Hemos visto que para cada tipo de transferencia, directa o retrógrada, obtene-
mos un ángulo de transferencia w, y a partir de éste los dos elementos que definen
el plano de la órbita ⌦, i que son comunes para todas las órbitas que pasan por
los dos puntos.
Una vez fijado w, podemos obtener el valor h
m
de la órbita de mı́nima enerǵıa
que pasa por los dos puntos. Obtenido éste, cada valor h > h
m
nos dará dos
órbitas O
1
(h),O
2
(h), cuyos elementos orbitales serán obtenidos en este apartado.
Fijado h, su signo, combinado con la expresión del semieje en función de la
enerǵıa, nos permite calcular el semieje de la órbita. Además, los semilados rectos
de las dos órbitas vienen dados por los valores p± de la ecuación (11.27). Si
fijamos, en lo que sigue, el semilado p de una de estas dos órbitas, esto es p
+
o
p�, podemos obtener el resto de elementos orbitales para esa órbita.
Si llamamos W = f
2
+ f
1
y recordamos que w = f
2
� f
1
, aśı como las expre-
siones (11.11), que nos dan el valor de e cos f y e sen f , podremos poner
cos
w
2
cos
W
2
=
1
2
(cos f
1
+ cos f
2
) =
1
2e
✓
p
r
1
+
p
r
2
� 2
◆
,
sen
w
2
sen
W
2
=
1
2
(cos f
1
� cos f
2
) =
1
2e
✓
p
r
1
� p
r
2
◆
,
que finalmente conduce a
e cos
W
2
=
1
2
✓p
r
1
+
p
r
2
� 2
◆
sec
w
2
,
e sen
W
2
=
1
2
✓
p
r
1
� p
r
2
◆
csc
w
2
,
(11.28)
que nos permite calcular e y W para cada uno de los dos casos.
A partir de w y W podemos calcular, sin ambigüedad, f
1
y f
2
f
1
=
W + w
2
, f
2
=
W � w
2
.
186 Órbitas keplerianas que pasan por dos puntos
Puesto que conocemos el vector l del sistema nodal y el vector u
1
del sistema
orbital en P
1
podemos calcular el ángulo ✓
1
que va de l a u
1
. Por otro lado, como
sabemos que ✓
1
= ! + f
1
, esto nos permite calcular el valor del argumento del
periastro !.
El último elemento orbital, la época de paso por el periastro, puede ser calcu-
lado si tenemos en cuenta la relación (10.36) que invertida nos da unos valores de
s
1
, s
2
, correspondientes a f
1
, f
2
, en la forma
s
i
= 2V�1
t
(
r
p
µ
1
1 + e
tan
f
i
2
; �2h).
A partir de s
1
la segunda ecuación (10.29)
t� T = r
p
s+ µeV
3
(s), (11.29)
nos da el valor de t
1
�T , lo que permite calcular la época de paso por el periastro
T si conocemos t
1
.
11.8 Tiempo de tránsito
La misma ecuación (11.29) nos permite obtener una expresión que nos da el
tiempo de tránsito entre P
1
y P
2
, para cada una de las órbitas con enerǵıa h,
como
�t(h) =
p
1 + e
(s
2
� s
1
) + µe [V
3
(s
2
)� V
3
(s
1
)] . (11.30)
La figura 11.4(a) nos muestra la gráfica correspondiente a los tiempos de trans-
ferencia, en función de la enerǵıa h, después de fijar los puntos P
1
, P
2
y el tipo
de transferencia (directa o retrógrada). La figura 11.4(b) muestra el conjunto de
todas las órbitas de transferencia para el mismo caso.
En la figura 11.4(a) podemos comprobar que no hay ningún valor a la izquierda
de la enerǵıa mı́nima h
m
. El valor t
m
corresponde al tiempo de transferencia de
la órbita eĺıptica correspondiente a esta enerǵıa. Esta órbita es la órbita E
m
de la
figura 11.4(b).
Si aumentamos la enerǵıa a un valor h
m
< h < 0 nos encontramos dos valores
de t, ambos correspondientes a las dos órbitas eĺıpticas correspondientes a la
enerǵıa h. Uno de los tiempos es menor que t
m
, el correspondiente a la órbita E
1
de la figura 11.4(b), mientras que el otro es mayor que t
m
y corresponde a E
2
.
Como se ve en la figura 11.4(b) el tiempo de tránsito en cada caso se corresponde
con un mayor arco recorrido. Si continuamos aumentando h, con valores negativos
tendiendo su valor hacia cero, una de las dos ramas de la curva tiende a1mientras
que el otro tiende al valor de t
p
correspondiente a la órbita parabólica de enerǵıa
h = 0 (órbita P en la figura 11.4(b)).
Órbitas keplerianas que pasan por dos puntos en dos instantes 187
h
t
h
m
0
(a) Tiempo de tránsito
E
m
E
1
E
2
P H
(b) Tipo de órbitas
Figura 11.4: Transferencias en función de la enerǵıa h
Finalmente, para valores de enerǵıa positivos, órbitas hiperbólicas, encontra-
mos dos valores de t uno positivo y otro negativo. El valor negativo puede ol-
vidarse, pues corresponde a una órbita imposible que proviene, en el ĺımite, de
las órbitas eĺıpticas de excentricidad muy grande y tiempo de tránsito tendiendo
a infinito, que en el ĺımite se transforman en una parábola y posteriormente en
hipérbolas. La única órbita posible para una enerǵıa positiva h es la que tiene un
tiempo de tránsito positivo y menor que t
p
(órbita H en la figura 11.4(b)).
11.9 Órbitas keplerianas que pasan por dos pun-
tos en dos instantes dados t1, t2
Si atendemos a la figura 11.4(a) podemos comprobar que, dado un tiempo �t
de tránsito entre P
1
y P
2
, existe una y sólo una órbita de trasferencia ente los dos
puntos, lo que demuestra que la solución del problema de Lambert es única.
Habitualmente, cuando se requiere la resolución de problema de Lambert para
el cálculo de las órbitas keplerianas que pasan por dos puntos en dos instantes
dados t
1
, t
2
, suele recurrirse, entre otros, al método iterativo de Gauss. En este
apartado vamos a proponer un nuevo método, basado en las propiedades del tiem-
po de transferencia del apartado anterior y que será muy simple de implementar
y comprender y además es válido para cualquier tipo de movimiento. El lector
interesado puede acudir a la literatura clásica, donde se describen otros método
que resuelven el mismo problema de forma más eficiente aunque, generalmente,
menos didáctica.
188 Órbitas keplerianas que pasan por dos puntos
Una vez fijado el sentido de la transferencia, y por tanto su ángulo w, inten-
taremos invertir la ecuación (11.30), esto es, intentaremos obtener el valor de la
enerǵıa h que nos da el tiempo de transferencia �t = t
2
� t
1
especificado2.
No conocemos de manera expĺıcita la función �t = �t(h) que nos da el tiempo
de la transferencia en función de la enerǵıa, ni su derivada, por lo que no podemos
utilizar el clásico método de Newton para el cálculo de las ráıces de la ecuación.
Sin embargo, la suavidad de la gráfica de dicha función, aśı como el conocimiento
sencillo, de los puntos t
m
, t
p
, que separan los distintos comportamientos de la
función, permiten aplicar el método de la secante o regula–falsi, que aunque de
convergencia no demasiado rápida nos da unos resultados suficientemente buenos
en cualquier circunstancia.
Dada una función f(x) = 0 y un intervalo [a, b] donde existe una sola ráız, y
por tanto signo(f(a)) 6= signo(f(b)), el método de la secante calcula un punto c,
más próximo a la ráız, por medio de la expresión
c = a� (b� a)f(a)
f(b)� f(a)
.
Si dicho punto no está suficientemente cerca de la ráız, sustituimos el interva-
lo [a, b] por otro [a, c] o bien [c, b] según que signo(f(a)) 6= signo(f(c)) o bien
signo(f(c)) 6= signo(f(b)). Una vez tomado este nuevo intervalo se repite el pro-
ceso de forma iterativa.
Con objeto de elegir el intervalo, de manera que el método sea convergente,
basta comparar t
2
� t
1
con t
m
y t
p
.
0 < t
2
� t
1
< t
p
, ) h 2 [0,1),
t
2
� t
1
= t
p
, ) h = 0,
t
p
< t
2
� t
1
< t
m
, ) h 2 [h
m
, 0],
t
2
� t
1
= t
m
, ) h = h
m
,
t
m
< t
2
� t
1
, ) h 2 [h
m
, 0].
La función f(h) se elige de entre las dos �
i
t teniendo en cuenta las tres reglas
siguientes:
Si t
2
� t
1
< t
p
se toma un valor cualquiera h
0
positivo y se elige el valor
f(h) = �t(h), tal que �t(h
0
) > 0.
Si t
p
< t
2
� t
1
< t
m
se toma un valor cualquiera h
0
negativo y mayor que
h
m
y se elige el valor f(h) = �t(h), tal que �t(h
0
) < t
m
.
Si t
m
< t
2
� t
1
se toma un valor cualquiera h
0
negativo y mayor que h
m
y
se elige el valor f(h) = �t(h), tal que �t(h
0
) > t
m
.
2Para aplicar este método podemos conocer el intervalo de tiempo �t o bien los instantes t1
de paso por P1 y t2 de paso por P2.
Parte III
Movimiento orbital
189
Caṕıtulo 12
Movimiento orbital
12.1 Ecuaciones del movimiento orbital
En el caṕıtulo 7 se han presentado las ecuaciones del movimiento kepleriano,
bien en su forma de ecuaciones de orden dos (7.23), o bien como ecuaciones de
orden uno (7.24). Ambos conjuntos de ecuaciones responden al modelo, que hemos
llamado movimiento kepleriano, del movimiento relativo de un punto material
respecto de otro, cuando ambos están atráıdos por la ley de atracción gravitacional
de Newton. Este modelo es una aproximación a la realidad, pues parte de dos
premisas que son falsas: no existen dos cuerpos aislados y éstos en ningún caso
representan puntos infinitesimales sino que son sistemas finitos de masas (sólidos).
Además, existen muchos otros efectos, gravitacionales y no gravitacionales, que
modifican el comportamiento del movimiento kepleriano y que dan lugar a lo
que llamaremos movimiento orbital, que constituye una mejor aproximación al
movimiento de los cuerpos observado en el sistema solar.
La mayor parte de los problemas orbitales pueden ser formulados a través de
un sistema de ecuaciones diferenciales similar a las del modelo kepleriano:
ẍ+ µ
x
r3
= P, (12.1)
donde se añade el vector P , que representa la perturbación o aceleración que
produce la perturbación. El sistema dado por (12.1) puede representarse también
como:
ẋ = X,
Ẋ = � µ
r3
x + P .
(12.2)
192 Movimiento orbital
Cuando se verifique la condición kP k ⌧ µ/r2, esto es, cuando la aceleración
que produce la perturbación sea mucho menor que la kepleriana, la solución del
sistema (12.1) o (12.2), será llamada movimiento kepleriano perturbado o simple-
mente movimiento orbital.
Si existe una función V
p
tal que se cumpla
P = �r
x
V
p
, (12.3)
podemos definir un hamiltoniano H
H(x,X) = H
k
+ V
p
=
1
2
X ·X � µ
kx k + V
p
, (12.4)
como suma del hamiltoniano kepleriano H
k
, dado en (7.25), y la función V
p
que
llamaremos potencial perturbador.
Las ecuaciones de Hamilton aplicadas a este hamiltoniano coinciden con las
ecuaciones (12.2) del movimiento orbital, por lo que ambos sistemas son equiva-
lentes y llamaremos a H(x,X) hamiltoniano del movimiento orbital.
12.2 Ecuaciones de Lagrange
El movimiento orbital, en ausencia de perturbaciones, coincide con el keple-
riano y puede ser descrito a través de un conjunto de constantes como son los
elementos orbitales. Cuando aparecen pequeñas perturbaciones el modelo puede
considerarse como instantáneamente kepleriano, esto es, en un cierto instante t
0
el movimiento puede ser descrito a través de seis constantes (a
0
, e
0
, i
0
, ⌦
0
,!
0
, T
0
),
llamadas elementos orbitales osculadores, que vaŕıan para un instante posterior.
De esta forma, los elementos orbitales pasan de ser constantes a ser variables en
t y las funciones (a(t), e(t), i(t),⌦(t),!(t), T (t)) permiten establecer la órbita os-
culatriz para cada instante y, con ella, cualquier elemento, incluidas la posición y
la velocidad.
Para encontrar las ecuaciones que rigen la variación de los elementos orbitales
con respecto al tiempo, que integradas nos determinarán el movimiento orbital,
deduciremos la relación diferencial entre éstas y las variables de Delaunay, vistas
en el apartado 9.9.
Diferenciando la expresión que define el movimiento medio n2a3 = µ, podemos
poner 2na3 dn+ 3n2a2 da = 0, de donde obtenemos
dn = �3n
2a
da. (12.5)
Diferenciando la expresión ` = n(t � T ) y sustituyendo el valor de dn por el
dado en (12.5) obtenemos
d` = ndt� ndT � 3n
2a
(t� T ) da. (12.6)
Ecuaciones de Lagrange 193
Las identidades g = !, h = ⌦, permiten poner
dg = d!, dh = d⌦. (12.7)
Las expresiones de los momentos de Delaunay (9.54) pueden ponerse también
como
L2 = µa, G2 = L2 (1� e2), H = Gc
i
,
donde hemos introducido la notación
c
i
= cos i, s
i
= sen i, (12.8)
que será usada de aqúı en adelante.
Diferenciando la primera de las relaciones anteriores se tiene
dL =
µ
2L
da. (12.9)
Diferenciando la expresión de G y sustituyendo dL por su valor (12.9) se llega a
dG =
µG
2L2
da� L2e
G
de. (12.10)
Finalmente, tras haber sustituido dG por su valor, dado en (12.10), se obtendrá pa-
ra H
dH =
µG
2L2
c
i
da� L2e
G
c
i
de+Gs
i
di. (12.11)
Reuniendo las expresiones (12.6),(12.7),(12.9),(12.10),(12.11), resolviendo el
sistema de ecuaciones en da, de, di, d⌦, d!, dT y sustituyendo las diferenciales por
las derivadas respecto al tiempo obtendremos finalmente:
da
dt
=
2L
µ
dL
dt
,
de
dt
=
G2
eL3
dL
dt
� G
eL2
dG
dt
,
di
dt
=
c
i
Gs
i
dG
dt
� 1
Gs
i
dH
dt
,
d⌦
dt
=
dh
dt
,
d!
dt
=
dg
dt
,
dT
dt
= 1� 1
n
d`
dt
� 3L
aµ
(t� T )
dL
dt
.
(12.12)
194 Movimiento orbital
Si expresamos el hamiltoniano del movimiento orbital H en variables de De-
launay
H = � µ2
2L2
+ V
p
,
las ecuaciones de Hamilton en estas variables serán:
d`
dt
=
µ2
L3
+
@V
p
@L
,
dL
dt
= �@Vp
@`
,
dg
dt
=
@V
p
@G
,
dG
dt
= �@Vp
@g
,
dh
dt
=
@V
p
@H
,
dH
dt
= �@Vp
@h
.
(12.13)
Aplicando la regla de la cadena para expresar las derivadas de V
p
respecto de
las variables de Delaunay en función de las derivadas de V
p
respecto de elementos
orbitales se tendrá
@V
p
@�
=
@V
p
@a
@a
@�
+
@V
p
@e
@e
@�
+
@V
p
@i
@i
@�
+
@V
p
@⌦
@⌦
@�
+
@V
p
@!
@!
@�
+
@V
p
@T
@T
@�
, (12.14)
donde � representa una cualquiera de las variables de Delaunay.
Llevando (12.14) a (12.13), éstas a (12.12) y sustituyendo las variables de
Delaunay por los elementos orbitales se llegará finalmente a las expresiones:
da
dt
= � 2
na
@V
p
@`
,
de
dt
=
p
1� e2
na2e
@V
p
@!
� 1� e2
na2e
@V
p
@`
,
di
dt
=
1
na2
p
1� e2s
i
@V
p
@⌦
� c
i
na2
p
1� e2s
i
@V
p
@!
,
d⌦
dt
=
�1
na2
p
1� e2s
i
@V
p
@i
,
d!
dt
=
�
p
1� e2
na2e
@V
p
@e
+
c
i
na2
p
1� e2s
i
@V
p
@i
,
d`
dt
= n+
2
na
@V
p
@a
+
1� e2
na2e
@V
p
@e
,
(12.15)
que son llamadas ecuaciones de Lagrange del movimiento planetario o simplemen-
te ecuaciones de Lagrange y nos dan la variación de los elementos orbitales de la
órbita perturbada por un potencial V
p
.1
La última ecuación de Lagrange nos da la variación de la anomaĺıa media con
respecto al tiempo en lugar de la variación de la época de paso por el periastro.
1En alguna publicación encontraremos las mismas expresiones con signo de V
p
cambiado,
debido a que toman V
p
como la función de fuerzas en lugar del potencial.
Ecuaciones de Gauss 195
Esto es aśı porque teniendo en cuenta la relación ` =
p
µ/a3(t� T ) podemos ob-
tener la variación de T a partir de la de `. Esta relación es más útil pues permite
expresar un cambio de variable de t a ` o, a través de ésta, a las anomaĺıas verda-
dera o excéntrica, que será la variable independiente en la que vendrá expresada
habitualmente la perturbación.
12.3 Ecuaciones de Gauss
Para determinado tipo de perturbaciones y de análisis es mejor la formulación
de las ecuaciones usando la fuerza perturbadora en lugar del potencial. Como
sabemos, la relación entre ambas vendrá dada por
r
x
V
p
= �P , (12.16)
donde P = PS representa la fuerza expresada en el sistema de referencia espacial.
Habitualmente la fuerza perturbadora viene expresada en el sistema de refe-
rencia orbital, PU , por medio de las componentes (P
u
,P
v
,P
n
), o en el de Frenet
PF con las componentes (P
t
,P
s
,P
n
). La relación entre el P y PU viene dada por
P = PS = R
3
(⌦)R
1
(i)R
3
(! + f)PU , (12.17)
esto es, se obtiene mediante el giro que pasa del sistema espacial al orbital. Com-
binando (12.16) con (12.17) se obtiene la expresión de r
x
V
p
en función de las
componentes de la fuerza en el sistema orbital.
Finalmente, las expresiones de las derivadas @V
p
/@�, donde sigma representa
cualquier elemento orbital, se obtienen aplicando la regla de la cadena a través
de la expresión
@V
p
@�
= r
x
V
p
· x
�
, (12.18)
donde x
�
= (
@x
@�
,
@y
@�
,
@z
@�
) se obtiene derivando, respecto a cada variable orbital
�, las componentes del vector x
x = R
3
(⌦)R
1
(i)R
3
(! + f)r, (12.19)
donde hemos llamado r = (r, 0, 0).
196 Movimiento orbital
Realizando todo este conjunto de operaciones se llega a las expresiones:
@V
p
@a
= � r
a
P
u
,
@V
p
@e
= a cos fP
u
� r(2 + e cos f) sen f
1� e2
P
v
,
@V
p
@i
= �r sen(! + f)P
n
,
@V
p
@⌦
= �rc
i
P
v
+ rs
i
cos(! + f)P
n
,
@V
p
@!
= �rP
v
,
@V
p
@`
=
�ae sen fp
1� e2
P
u
� a2(1� e2)
r
p
1� e2
P
v
.
(12.20)
Finalmente, sustituyendo los valores de las expresiones (12.20) en las ecuacio-
nes (12.15), y llamando ⌘ =
p
1� e2, obtenemos las ecuaciones:
da
dt
=
2e sen f
n ⌘
P
u
+
2 a ⌘
n r
P
v
,
de
dt
=
⌘ sen f
a n
P
u
+
✓
⌘3
e r n
� r ⌘
a2 e n
◆
P
v
,
di
dt
=
r cos(! + f)
a2 n ⌘
P
n
,
d⌦
dt
=
r sen(! + f)
a2 n s
i
⌘
P
n
,
d!
dt
=
⌘ cos f
a e n
P
u
+
r(2 + e cos f) sen f
a2 n e ⌘
P
v
+
r sen(! + f) c
i
a2 n s
i
⌘
P
n
,
d`
dt
= n+
✓
�2 r
a2 n
+
⌘2 cos f
a e n
◆
P
u
� r(2 + e cos f) sen f
a2 e n
P
n
.
(12.21)
que son llamadas ecuaciones de Gauss.
Observando las ecuaciones de Gauss podemos sacar una serie de conclusionesinteresantes del movimiento orbital:
El semieje y la excentricidad solo están perturbados por la componente
radial y transversal de la fuerza perturbadora. Si esta fuerza es perpendicular
al plano orbital el semieje y la excentricidad no vaŕıan.
La inclinación y el ángulo del nodo solo dependen de la componente normal
de la fuerza perturbadora. Si esta fuerza está contenida en el plano del
movimiento la inclinación y el ángulo del nodo, o lo que es igual el plano
orbital, no vaŕıan.
Perturbaciones de corto y largo periodo y seculares 197
Si tenemos en cuenta las relaciones entre (P
u
,P
v
,P
n
) y (P
t
,P
s
,P
n
) dadas por
PU = R
3
(�) · PF y las llevamos a (12.21) podemos obtener otra versión de las
ecuaciones de Gauss en función de las componentes de la fuerza en el sistema de
Frenet.
12.4 Perturbaciones de corto y largo periodo y
seculares
Cuando se analiza el comportamiento del movimiento orbital frente al ke-
pleriano, sea cual sea el tipo de fuerza externa que actúa sobre el orbitador, se
observan tres tipos distintos de perturbaciones en el movimiento orbital.
Supongamos que queremos analizar la evolución de un elemento orbital, �,
que en el movimiento kepleriano representa una constante y por tanto viene re-
presentado, en la gráfica 12.1, por una ĺınea recta. En el movimiento orbital este
parámetro dejará de ser constante y su variación vendrá representada por la fun-
ción �(t) que puede contener términos de tres tipos:
Términos de tipo polinómicos en t. Estos términos producen un desplaza-
miento secular de la gráfica de � respecto de su valor kepleriano constante.
Términos en seno y coseno de las variables angulares !,⌦, i. Puesto que
el valor de estas variables angulares vaŕıa muy lentamente estos términos
producen una oscilación periódica, de periodo muy grande. Estos términos
son llamados de largo periodo.
Finalmente aparecen senos y cosenos de la variable ` que tiene el periodo
de la órbita. Estos términos producen pequeñas oscilaciones en torno a la
combinación de la perturbación secular y de largo periodo, y son llamados
de corto periodo.
Figura 12.1: Perturbaciones de corto y largo pe-
riodo y seculares.
Si se precisa la posición y ve-
locidad de un cuerpo en su órbi-
ta en una instante dado es preci-
so obtener las tres perturbacio-
nes. Sin embargo, si únicamen-
te se desea conocer como evolu-
cionará una órbita a largo plazo,
sin preocuparnos de la posición
instantánea del cuerpo, podemos
prescindir de las perturbaciones
de corto periodo y analizar úni-
camente las de largo periodo y se-
culares.
198 Movimiento orbital
Esto enlaza con el concepto, muy usado en Astrodinámica, de elementos os-
culadores y elementos medios. Los elementos orbitales, que son constantes en el
movimiento kepleriano, se convierten en funciones de t en el movimiento orbital.
A los elementos orbitales particularizados en un instante dado se les llama ele-
mentos osculadores, porque en dicho instante estos elementos definen una órbita
kepleriana instantánea, llamada órbita osculatriz, que tiene un punto de contac-
to con la órbita real, justo en el punto del espacio que ocupa el orbitador en el
instante en que se han calculado los elementos orbitales. La órbita osculatriz en
cada instante representa perfectamente todas las caracteŕısticas de la órbita real
pero únicamente en ese instante.
Los elementos medios son los elementos que se obtienen promediando los ele-
mentos osculadores en un periodo orbital. Esto supone, en la práctica, eliminar las
perturbaciones de corto periodo, lo que nos permite conocer la evolución de largo
periodo y secular. La aplicación de las expresiones del movimiento kepleriano a la
órbita promediada, formada a partir de los elementos medios, nos da únicamente
una aproximación al comportamiento de la órbita real.
12.5 Método de aproximaciones sucesivas
Las perturbaciones de los problemas orbitales vienen expresadas habitualmen-
te como un desarrollo en serie de potencias de un pequeño parámetro ✏. Las bases
matemáticas del tratamiento asintótico de las teoŕıas de perturbaciones están a
menudo camufladas por el gran número de variables y de términos de sus expre-
siones. Un ejemplo muy simple nos servirá para ilustrar, tanto el método clásico
de aproximaciones sucesivas, como el concepto de orden de aproximación de una
teoŕıa.
Sea la ecuación diferencial de primer orden dada por
ẋ = 2 ✏ t x, x
0
= x(t = 0), ✏⌧ 1, (12.22)
cuya solución general puede expresarse en la forma
x = x
0
e✏t
2
, (12.23)
cuyo desarrollo en serie de potencias en torno a ✏ viene dado por la expresión
x = x
0
X
i�0
✏i
i!
t2i = x
0
1 + ✏t2 +
✏2
2
t4 + . . .
�
. (12.24)
Podemos suponer la solución x(t) de la ecuación (12.22) como el resultado de
perturbar la ecuación diferencial ẋ = 0, cuya solución es x = x
0
, con una pequeña
perturbación 2 ✏ t x
0
. De esta forma, la solución del problema perturbado será
x = x
0
+ ✏x
1
(t) + ✏2x
2
(t) + . . . . (12.25)
Perturbaciones de primer orden en el movimiento orbital 199
El método de aproximaciones sucesivas consistirá en calcular sucesivamente, orden
a orden, las expresiones de x
1
(t), x
2
(t), etc.
Como primera aproximación a la ecuación diferencial (12.22) usaremos la so-
lución de ésta haciendo ✏ = 0, esto es de ẋ = 0, que integrada nos da x = x
0
.
Ésta será llamada solución de orden cero o del problema no perturbado, porque
en ella no aparece ✏ ni, por lo tanto, el efecto de la perturbación. En el problema
orbital la solución de orden cero coincidirá con la del modelo kepleriano.
Una solución más aproximada se obtiene tomando como ecuación diferencial
el resultado de sustituir la solución de orden cero en la ecuación (12.22), con lo
que la ecuación diferencial se transforma en ẋ = 2 ✏ t x
0
, o bien, dx = 2 ✏ t x
0
dt,
cuya integración nos da
x� x
0
=
Z
t
0
2 ✏x
0
t dt = ✏x
0
t2,
o lo que es igual x = x
0
⇥
1 + ✏ t2
⇤
, que es llamada solución de primer orden, pues
en ella aparecen términos lineales en ✏.
Para aumentar la aproximación, introduzcamos la solución de primer orden
en la ecuación original (12.22) lo que nos lleva a la ecuación diferencial
dx
dt
= 2✏x
0
⇥
1 + ✏ t2
⇤
t, (12.26)
que integrada resulta
x
0
1 + ✏ t2 +
✏2
2
t4
�
, (12.27)
y es llamada solución de orden dos. El proceso puede repetirse hasta obtener la
precisión deseada, obteniéndose términos cada vez más pequeños que se aproximan
cada vez más a la solución correcta. Como puede verse, la solución de orden n
corresponde a truncar el desarrollo en serie (12.24) en el orden n.
12.6 Perturbaciones de primer orden en el movi-
miento orbital
En el problema orbital no perturbado el valor de V
p
= 0, llevado a las ecuacio-
nes de Lagrange (12.15), nos permite obtener la solución de orden cero, que puede
expresarse en elementos orbitales como � = �
0
, donde usaremos el śımbolo � para
representar uno cualquiera de los seis elementos orbitales y � para el vector de
elementos orbitales ordinarios � = (a, e, i,⌦,!, T ).
El valor de la perturbación V
p
no suele venir expresado en función de t sino de
la anomaĺıa verdadera f o la excéntrica E, por lo que las ecuaciones de Lagrange
estarán expresadas en una de las dos formas que siguen:
�̇ = �(�, f) = (�, E). (12.28)
200 Movimiento orbital
La solución de primer orden se obtendrá sustituyendo � por �
0
en la parte
derecha de las ecuaciones de Lagrange e integrando éstas. De esta forma, el sistema
de ecuaciones diferenciales puede tratarse como seis ecuaciones diferenciales que
pueden integrarse de manera independiente, obteniendo, por separado, la variación
de primer orden de cada uno de los elementos orbitales por medio de las ecuaciones
�̇ = �(�
0
, f) = (�
0
, E). (12.29)
Si V
p
viene expresada en función de f será necesario sustituir �̇ por d�/d f .
Para ello, teniendo en cuenta la ley de las áreas