Libro de Algebra y Pre Fiuna
Libro de Algebra y Pre Fiuna
Material de
Teoría:
Algebra y pre cálculo
Editado por:
La Dirección de Admisión y la
Coordinación de Matemática de la Dirección del Departamento de Cursos
Básicos de la F.I.U.N.A.
1 Conjuntos y Funciones                                                                                                      1
  1.1 Conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .                   .   .   .   .   .   .    1
      1.1.1 Relación de pertenencia y representaciónes de conjuntos . . .                         .   .   .   .   .   .    2
      1.1.2 Subconjuntos - Relación de inclusión e Igualdad de Conjuntos                          .   .   .   .   .   .    3
      1.1.3 Conjunto vacı́o - conjuntos finitos y conjuntos infinitos . . . .                       .   .   .   .   .   .    6
      1.1.4 Operaciones con conjuntos . . . . . . . . . . . . . . . . . . . .                       .   .   .   .   .   .    8
      1.1.5 Ejercicios Adicionales . . . . . . . . . . . . . . . . . . . . . . .                    .   .   .   .   .   .   12
  1.2 Funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .                   .   .   .   .   .   .   13
      1.2.1 Inyectividad, Sobreyectividad y Biyectividad . . . . . . . . . .                        .   .   .   .   .   .   15
      1.2.2 Composición de funciones - Inversas . . . . . . . . . . . . . . .                      .   .   .   .   .   .   16
      1.2.3 Ejercicios Adicionales . . . . . . . . . . . . . . . . . . . . . . .                    .   .   .   .   .   .   18
2 Conjuntos Numéricos                                                                                                      20
  2.1 Naturales y Enteros . . . . . . . . . . . . . . . . . . . .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   20
      2.1.1 Divisibilidad . . . . . . . . . . . . . . . . . . . .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   24
      2.1.2 Máximo común divisor - Algoritmo de Euclides          .   .   .   .   .   .   .   .   .   .   .   .   .   .   26
  2.2 Racionales y Reales . . . . . . . . . . . . . . . . . . . .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   31
      2.2.1 La recta numérica real . . . . . . . . . . . . . .     .   .   .   .   .   .   .   .   .   .   .   .   .   .   36
      2.2.2 Operaciones básicas con números reales . . . . .      .   .   .   .   .   .   .   .   .   .   .   .   .   .   39
  2.3 Números Complejos . . . . . . . . . . . . . . . . . . . .    .   .   .   .   .   .   .   .   .   .   .   .   .   .   41
      2.3.1 Representaciones de números complejos . . . . .        .   .   .   .   .   .   .   .   .   .   .   .   .   .   47
      2.3.2 Fórmula de De Moivre - Raı́ces de la unidad . .        .   .   .   .   .   .   .   .   .   .   .   .   .   .   49
                                               iv
         3.1.2 Raı́ces y Teorema Fundamental del Álgebra                          .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   57
   3.2   Funciones polinomiales . . . . . . . . . . . . . . . .                    .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   60
         3.2.1 Gráficas en el plano cartesiano . . . . . . . .                    .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   61
   3.3   Funciones Racionales e Irracionales . . . . . . . . .                     .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   62
         3.3.1 Asintotas de funciones racionales . . . . . .                       .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   64
         3.3.2 Funciones irracionales . . . . . . . . . . . .                      .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   66
5 Combinatoria Básica                                                                                                                             84
  5.1 Principios fundamentales de conteo . . . . . . . . . .                           .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   85
  5.2 Arreglos . . . . . . . . . . . . . . . . . . . . . . . . .                       .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   88
      5.2.1 Permutaciones - Variaciones - Combinaciones                                .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   88
      5.2.2 Arreglos con repeticiones . . . . . . . . . . . .                          .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   90
  5.3 Binomio de Newton . . . . . . . . . . . . . . . . . . .                          .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   91
6 Álgebra Matricial                                                                                                                                94
  6.1 Definición y ejemplos . . . . . . . .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .    94
  6.2 Operaciones con matrices . . . . . .     .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .    96
       6.2.1 Suma y producto por escalar       .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .    96
       6.2.2 Producto de matrices . . . .      .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .    97
  6.3 Algunas matrices especiales . . . .      .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   100
       6.3.1 Determinante . . . . . . . .      .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   102
              6.3.1.1 Regla de Sarrus . .      .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   106
Conjuntos y Funciones
1.1      Conjuntos
El objetivo de esta sección no es un desarrollo axiomático de la teorı́a de conjuntos, sino apenas
el de establecer la noción de conjunto desde una base intuitiva, e introducir los conceptos
y terminologı́as más relevantes para nuestro propósito. La referencia estándar para lo que
comentaremos aquı́ es el libro Naive Set Theory, de Paul Halmos[4]. Incluso en dicho libro,
como su nombre lo indica, el autor no pretende el desarrollo completamente axiomático del
tema, pero mismo ası́, es mucho más exhaustivo de lo que cubriremos aquı́.
                                                 1
1.1.1     Relación de pertenencia y representaciónes de conjuntos
Usaremos el término conjunto para referirnos a una colección de objetos que, por determinadas
caracterı́sticas compartidas, los identificamos como miembros de un mismo grupo. El lector
puede imaginar, como ejemplo, una colección de sillas que hay en su casa, o una colección de
números con determinada propiedad. En el primer caso los objetos son concretos (las sillas),
mientras que en el segundo caso los objetos son abstractos (números que satisfacen alguna
propiedad). En el estudio de las matemáticas, especialmente en su desarrollo teórico, lo más
frecuente es que los objetos considerados sean abstractos.
    La relación fundamental entre los objetos que conforman un conjunto, y el conjunto mismo,
es el de pertenencia. Ası́, si denotamos un determinado conjunto mediante el sı́mbolo A, y
mediante x uno cualquiera de los objetos que conforman A, decimos que x es un elemento de
A, o que x pertenece a A. Denotamos dicha situación mediante el sı́mbolo
x ∈ A.
que se lee “y no pertenece a A”, o “y no está en A”, o alguna otra expresión suficientemente
clara para indicar la misma idea.
    La forma más usual de representar (o expresar) un determinado conjunto es colocando
entre llaves ya sea la lista explı́cita de sus elementos, o la la(s) propiedad(es) que define(n) a
sus elementos. En el primer caso, decimos que el conjunto está representado por extensión, y
en el segundo caso, decimos que el conjunto está representado por comprensión.
    Por ejemplo, el conjunto
                                          X = {2, 4, 6, 10},
Aquı́, x denota el objeto y Q denota una o varias propiedades que el objeto x debe satisfacer para
ser un elemento de A. Para ilustrar esto, podemos considerar que Q es la propiedad: “número
                                                2
par positivo”. Entonces, el mismo conjunto P descrito anteriormente puede representarse como
P = {x; x satisface Q}
Notemos que en este ejemplo, Q representa de hecho una colección de propiedades, a saber: x
debe ser un número, debe ser positivo y debe ser par.
Ejercicio 1.1.1. Determine en cada caso si el conjunto está representado por extensión o por
comprensión.
a) A = {+, 6, #, @}.
    En varias ocaciones es muy útil una representación gráfica de los conjuntos. Estos diagramas
conocidos como diagramas de Venn-Euler, consisten de figuras (elı́pses, cı́rculo, poligonales
cerradas), y sus elementos pueden etiquetarse explı́citamente dentro de la figura, o bien ser
descritas mediante la(s) propiedad(es) que los definen. Es decir, las representaciones por ex-
tensión y por comprensión pueden igualmente combinarse con los diagramas de Venn-Euler,
como se ilustra en la Figura 1.1.
                                                3
podemos estar interesados en aquellos que son mayores que 6. Podemos, por ejemplo, escribir:
P6 = {x ∈ P ; x > 6}.
Lo cual se puede leer como: “P6 es el conjunto conformado por elementos de P que son mayores
que 6”.
   En este caso, hemos definido el conjunto P6 especificando que sus elementos son aquellos
elementos de P que son mayores que 6. Observamos entonces el hecho obvio de que todo
elemento de P6 es también un elemento de P , y decimos que P6 es un subconjunto de P .
   En un caso general, dado un conjunto X, diremos que otro conjunto Y es un subconjunto
de X si todo elemento de Y es también elemento de X. Denotaremos tal situación mediante
Y ⊆ X.
u ∈ Y =⇒ u ∈ X,
y
        Y = {automóviles registrados en el territorio paraguayo, y están asegurados.}
En este caso, está claro que los elementos del conjunto Y satisfacen la condición para ser
también elementos del conjunto X, y por lo tanto podemos afirmar que Y es un subconjunto de
X, y denotarlo como Y ⊆ X.
   En lugar de decir que Y es subconjunto de X, también podemos decir que “Y está contenido
en X”, o que “X contiene a Y ”, o que “Y está incluido en X”. Observemos que para cualquier
conjunto Y siempre se tiene Y ⊆ Y . Observemos también que la condición “todo elemento de
Y es también elemento de X” no prohı́be que Y sea el propio X. Si necesitamos hacer énfasis
en el caso en que no todo elemento de X pertenece a Y , usaremos la notación
Y ⊂ X,
la cual se lee “Y es subconjunto propio de X”. También se usa la expresión: “Y está es-
trictamente incluido en X”. Retomando los ejemplos anteriores, podemos afirmar que P6 es
                                               4
subconjunto propio de P . También, sabemos que existen automóviles registrados en el territo-
rio paraguayo, pero no están asegurados, por tanto, también podemos afirmar que Y ⊂ X en
el Ejemplo 1.1.2.
    En varias situaciones estaremos trabajando con varios subconjuntos de un mismo conjunto.
En tales situaciones es usual llamar conjunto universal al conjunto que contiene a todos
los subconjuntos que estamos considerando. Por ejemplo, en determinada situación podemos
estar trabajando exclusivamente con números enteros positivos, que denotaremos mediante el
sı́mbolo N, y entonces este será el conjunto universal. Sin embargo, si pasamos a analizar
números enteros negativos, el conjunto N deja de ser el universal, y dicho estatus lo puede
tomar el conjunto de números enteros, que denotaremos mediante Z.
    Dados dos conjuntos U y W , diremos que son iguales si U ⊆ W y W ⊆ U , es decir, si todo
elemento de U es elemento de W y todo elemento de W es elemento de U . Esto es relevante en
muchas situaciones en matemáticas, en que se obtienen dos conjuntos mediante descripciones
diferentes de sus elementos, pero que en realidad son lo mismo. Entonces, para establecer la
igualdad, por lo general se intenta establecer la inclusión en ambos sentidos (también llamado
doble inclusión). Considere como ejemplo los conjuntos
y
                 B = {Triángulos que tienen sus tres ángulos internos iguales}.
Resulta que estos conjuntos, a pesar de estar definidos por propiedades diferentes, son de hecho
iguales, pues puede demostrarse que todo triángulo equilátero tiene también iguales sus tres
ángulos internos. En sı́mbolos, describimos esta situación como:
A = B,
donde el sı́mbolo de doble implicación, ⇔, se lee “si, y sólo si”. Ası́, podemos leer la expresión
completa como: “x pertenece a A si, y sólo si, x pertenece a B”.
   Para cerrar esta sección, enunciaremos una Proposición (afirmación que debe ser justificada)
que resume las propiedades más relevantes de la relación de inclusión.
                                                 5
  c) Es transitiva. Esto quiere decir que, dados tres conjuntos A, B y C, si A ⊆ B y B ⊆ C,
     entonces A ⊆ C.
Observación 1. Las Proposiciones (y Teoremas) son afirmaciones que deben ser “probadas”
o “demostradas”. Una prueba, o demostración, es un argumento que justifica la veracidad de
la afirmación, generalmente reduciendo la afirmación hecha a otras previamente establecidas,
o cuyas veracidades son evidentes o fueron tomadas como definición. A modo de ejemplo,
escribiremos una prueba de la Proposición 1.1.3.
Observación 2. La prueba que acabamos de escribir es más extensa de lo que realmente merece.
Las afirmaciones como las del ı́tem a) y b) suelen argumentarse simplemente con “esto es obvio”
y “esto es por definición”. Si para usted la afirmación del ı́tem a) no es obvia, tómese un tiempo
para volver a leerla detenidamente, y lea también la definición de inclusión. El ejercicio mental
de llegar a convencerse de que realmente es obvia es productivo.
                                                 6
donde Q es una propiedad imposible para cualquier objeto. Por ejemplo, podrı́amos considerar
∅ = {x; x ̸= x}.
Es decir, la propiedad (imposible) que exigimos es que el objeto x no sea igual a sı́ mismo.
Como ejemplo menos abstracto, podemos considerar
∅ = {x ∈ N; x2 = −1}.
Observación 3. Puede parecer un artificio innecesario preocuparse por definir y dar una no-
tación para una colección de objetos que ningún objeto puede satisfacer. Si usted siente que
es un artificio innecesario, piense que algo muy similar ocurre con el número cero (que deno-
tamos usualmente como 0). Este es un número que representa la ausencia de cantidad, y su
introducción al sistema numérico fue relativamente reciente en la historia del desarrollo de los
sitemas numéricos. Pero artificial como parecı́a en su momento, su introducción representó
una enorme propulsión al desarrollo de la aritmética, del álgebra, y de la matemática en gen-
eral. Tendremos ocasión en este curso de ver algunas situaciones en que el conjunto vacı́o nos
permite capturar con precisión ideas interesantes.
    Para cerrar esta sección, daremos una definición intuitiva de lo que son los conjuntos finitos
y los conjuntos infinitos. Una definición más rigurosa será abordada cuando hayamos discutido
el concepto de función y hayamos desarrollado más familiaridad con las propiedades de los
números naturales.
    Diremos que un conjunto A es finito si es vacı́o o si podemos listar todos sus elementos.
Caso contrario, es infinito. Expliquemos por qué esta “definición” no es rigurosa. Primero
está el significado de la palabra “listar”, pero asumiremos que entendemos intuitivamente lo
que eso significa. Más delicada es la condición “si podemos listar”, pues aquı́, “poder” se refiere
a una posibilidad que en la práctica podrı́a ser imposible. Por ejemplo, a partir de la definición
rigurosa, se puede concluir que el conjunto de estrellas en el universo observable es finito, sin
embargo, escapa a la capacidad (real) de cualquier persona el listar todos los elementos del
mencionado conjunto. Ası́, la posibilidad de listar al que se hace referencia en esta definición
intuitiva es una posibilidad matemática. Decimos entonces que un conjunto es finito si “en
principio podemos listar” todos sus elementos. Aquı́, la expresión “en principio” enfatiza que
en la práctica puede ser imposible realizar dicho listado.
                                                 7
1.1.4     Operaciones con conjuntos
Consideremos ahora dos conjuntos, digamos X e Y , entonces podemos estar interesados en
aquellos elementos que pertenecen tanto a X como a Y . Para ello definimos la intersección
de X e Y , mediante
                               X ∩ Y := {u; u ∈ X, y u ∈ Y },
donde el sı́mbolo := significa que lo que está a su derecha es la definición de lo que está a su
izquierda. Notemos que la “y” cumple su papel usual de conjunción copulativa.
    Ilustremos esto con un ejemplo. Sea X el conjunto de triángulos isosceles y sea Y el conjunto
de triángulos rectángulos. Entonces X ∩Y es el conjunto de triángulos rectángulos cuyos catetos
son iguales.
    Está claro que podemos estar interesados en la intersección de más de dos conjuntos. Consi-
deremos entonces que tenemos una familia de conjuntos Xλ , donde λ es un “ı́ndice” o “etiqueta”
que nos permite identificar a cada conjunto de la familia. Supongamos que λ pertenece a un
conjunto L, que llamaremos conjunto de ı́ndices. Entonces definimos la intersección de todos
los Xλ como                       \
                                     Xλ := {u; u ∈ Xλ , ∀λ ∈ L},
                                 λ∈L
                                                                      T
donde el sı́mbolo ∀ se lee “para todo”. Ası́, en palabras, el conjunto λ∈L Xλ está conformado
por los objetos que pertenecen a todos los Xλ .
   Cuando dos conjuntos X e Y no tienen elementos en común, decimos que son disjuntos.
Este es uno de los primeros conceptos que podemos capturar elegantemente con la idea de
conjunto vacı́o. En efecto, podemos decir que dos conjuntos X e Y son disjuntos si, y sólo si,
X ∩ Y = ∅.
   Lo cual captura de forma precisa la idea de que dichos conjuntos no tienen elementos en
común.
a) A ∩ (B ∩ C) = (A ∩ B) ∩ C.
b) A ∩ B = B ∩ C.
                                                8
  c) A ∩ ∅ = ∅.
                                          S
Ası́, para que un objeto pertenezca a         λ∈L   Xλ , basta que pertenezca a al menos uno de los
conjuntos Xλ .
a) A ∪ (B ∪ C) = (A ∪ B) ∪ C.
b) A ∪ B = B ∪ C.
c) A ∪ ∅ = A.
                                      XYC := {u ∈ Y ; u ∈
                                                        / X}.
                                                     9
obtiene el mismo conjunto si dicho complemento lo tomamos respecto de R que si lo tomamos
respecto de Z. En tal caso, será útil la notación más especı́fica, como por ejemplo NC
                                                                                         Z o bien
  C
NR .
    Un resultado importante en la teorı́a de conjuntos, que relaciona la unión y la intersección
con el complemento, es la Ley de De Morgan.
1. (A ∪ B)C = AC ∩ B C .
2. (A ∩ B)C = AC ∪ B C .
2. Ejercicio.
                                 X \ Y := {u; u ∈ X y u ∈
                                                        / Y }.
A∆B := (A \ B) ∪ (B \ A).
en tanto que
                                 B = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}.
                                                 10
                  Figure 1.2: Diferencia simétrica en Diagrama de Venn-Euler
Entonces tenemos
A∆B = {−4, −3, −2, −1, 0} ∪ {5, 6, 7, 8, 9, 10} = {−4, −3, −2, −1, 0, 5, 6, 7, 8, 9, 10}.
    La igualdad de A∆B y B∆A del ejemplo anterior no es casualidad. Esto se tiene en general,
como puede observarse fácilmente del hecho que la unión es simétrica (Ejercicio 1.1.8, ı́tem b)).
Este ejemplo también ilustra que A∆B comprende los elementos de la unión menos aquellos
de la intersección. Grágicamente, esto puede apreciarse fácilmente mediante los diagramas de
Venn-Euler, como se puede ver en la Figura 1.2, donde la diferencia simétrica de los conjuntos
indicados está conformada por la parte sombreada. Ofrezcamos un argumento formal para esta
observación.
Observación 4. El ejercicio precedente ilustra algo que vale la pena comentar. La inter-
pretación gráfica de la diferencia simétrica es extremadamente simple y clara, sin embargo, una
figura no constituye una prueba. Esto se debe a que en muchas situaciones las interpretaciones
gráficas pueden “engañarnos”, y sólo un análisis riguroso nos permite “evitar” el engaño. Es un
                                                11
buen ejercicio argumentar rigurosamente sobre conceptos que son intuitivamente claros, pues
esto afila la mente para buscar los argumentos rigurosos cuando el concepto no es intuitivo, o
la intuición podrı́a estar errada.
P(A) = {∅, {a}, {b}, {c}, {a, b}, {a, c}, {b, c}, {a, b, c}}.
    Por último, veamos el producto cartesiano de conjuntos. Para ello, consideremos conjuntos
X1 , X2 , . . . , Xr , entonces, su “producto cartesiano” es el conjunto
    Es decir, es el conjunto cuyos elementos son todas las listas ordenadas de r objetos, tal que
el i-ésimo es elemento de Xi , para todos los valores posibles del ı́ndice i. Por ejemplo, si X1
es el conjunto de sı́mbolos del alfabeto castellano, y X2 = N, entonces (a, 2) ∈ X1 × X2 , pero
(2, a) ∈/ X1 × X2 . Tampoco (b, π) es un elemento de X1 × X2 , pues π ∈   / X2 = N.
    Cuando tenemos apenas dos conjuntos, A y B, puede ser útil representar gráficamente el
producto cartesiano A × B como un rectángulo cuya base es A y cuya altura es B. Entonces
los elementos de A × B se pueden identificar con puntos dentro de dicho rectángulo. Un caso
de especial interés para nosotros será cuando A = B = R. En ese caso, usamos la notación
R × R = R2 , y el rectángulo correspondiente es un plano infinito. En dicho plano es usual trazar
dos rectas perpendiculares, una por cada factor R, y se lo conoce como plano cartesiano. Cabe
mencionar que el término plano cartesiano implica algunas consideraciones técnicas adicionales,
que iremos viendo oportunamente.
    Nota: La existencia del producto cartesiano de una familia arbitraria de conjuntos es
equivalente al axioma de elección. Para nuestros propósitos es suficiente considerar el caso de
una colección finita de conjuntos, como lo hicimos acá. El lector interesado en profundizarlo
puede consultar [4].
                                                     12
  1. (AC )C = A.
2. A ⊆ B =⇒ B C ⊆ AC .
3. A = ∅ ⇔ AC = E.
1. A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ B).
2. A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C).
A∆B := (A \ B) ∪ (B \ A).
1. (A ∪ B) × C = (A × C) ∪ (B × C).
2. (A ∩ B) × C = (A ∩ C) × (B ∩ C).
3. (A \ B) × C = (A × C) \ (B × C).
4. A ⊆ A′ , B ⊂ B ′ =⇒ A × B ⊆ A′ × B ′ .
1.2     Funciones
Dados dos conjuntos, A y B, una función de A en B es un subconjunto F ⊆ A × B, de tal
forma que para cada a ∈ A, existe un único elemento b ∈ B tal que (a, b) ∈ F . El conjunto A
se llama dominio de la función, y el conjunto B se llama codominio de la función.
    Si graficamos en un plano el producto cartesiano A × B como un rectángulo cuya base
representa al conjunto A y cuya altura representa al conjunto B, la condición especificada para
que el subconjunto F ⊆ A × B sea una función es que cualquier lı́nea vertical que atraviesa el
rectángulo, debe contener exactamente 1 elemento de F (ver Figura 1.3).
                                              13
                       Figure 1.3: Representación gráfica de una función
   Dada una función F ⊆ A × B podemos designar mediante f una regla de asignación tal
que, dado a ∈ A, la regla f determina el único elemento b ∈ B tal que (a, b) ∈ F . Podemos
indicar dicha determinación mediante f (a), e introducir la notación más usual de función:
f : A → B.
    En esta notación, es usual referirse a f como “la función”, sin embargo, es importante
recordar que una función es más que la regla especificada por f , pues los conjuntos A (dominio)
y B(codominio) son parte de la definición. También, cuando se expresa la función en la forma
f : A → B, es usual referirse al correspondiente subconjunto F ⊂ A × B como el gráfico de
f . Dada una función f : A → B, tenemos
                                               14
de y bajo f , o simplemente preimagen de y, si no hay riesgo de confusión. Notemos que,
dado x ∈ A, dicho elemento tiene una única imagen f (x) ∈ B, sin embargo, dado y ∈ B,
dicho elemento puede no tener preimagen, o puede que tenga una sola preimagen, o puede que
tenga varias preimágenes. Se usa la notación f −1 (y) para referirse al subconjunto de A cuyos
elementos son las preimágenes de y. Si Y ⊆ B es un subconjunto, su preimagen bajo f , o
simplemente su preimagen, es el conjunto
f −1 (Y ) := {x ∈ A; f (x) ∈ Y }.
Esto es, son todos los elementos de A tales que la regla f les asigna algún elemento en Y .
IA (x) = x.
Ejemplo 1.2.3. Denotemos por R+ el conjunto de números reales mayores que cero, y consi-
deremos la función f : R+ → R dada por f (x) = x2 . Esta función es inyectiva, pues, dados
x ̸= y ∈ R+ , tenemos f (x) = x2 ̸= y 2 = f (y).
                                                15
    Diremos que la función f : A → B es sobreyectiva si Im(f ) = B (recuerde que Im(f ) =
f (A)). Esto equivale a afirmar que todo elemento de B tiene preimagen.
Ejemplo 1.2.4. Sea f : R+ → R+ , dada por f (x) = x2 . Esta función es sobreyectiva, pues
                                              √                                 √
dado cualquier y ∈ R+ , su raı́z cuadrada, x = y ∈ R+ , satisface f (x) = x2 = ( y)2 = y.
Ejercicio 1.2.6. Muestre que Im(g ◦ f ) ⊆ Im(g). Ilustre con un ejemplo un caso de inclusión
estricta.
    Es claro que podemos componer más de dos funciones, desde que se den las condiciones de
inclusión apropiadas. Por ejemplo, si h : E → F es una tercera función, tal que Im(g ◦ f ) ⊆ E,
entonces podrı́amos considerar la función
h ◦ (g ◦ f ) : A → F, (1.1)
                                                16
Im(g) ⊆ E, en el sentido de que la primera podrı́a darse sin que se tenga la segunda, pero si se
tiene la segunda, necesariamente se tendrá la primera (ver Ejercicio 1.2.6). Eso significa que,
si estamos en un caso en que tenemos Im(g ◦ f ) ⊆ E, pero no tenemos Im(g) ⊆ E, entonces
la función (1.1) existe, pero la función (1.2) no, ası́ que no tendrı́a sentido plantear que sean
iguales. Sin embargo, si tenemos la condición Im(g) ⊆ E, también tendremos la condición
Im(g ◦ f ) ⊆ E, y por lo tanto ambas funciones existirán, y serán iguales.
                                                17
     Recı́procamente, supongamos que g : B → A sea una inversa a izquierda de f . Conside-
     remos entonces dos elementos x1 ̸= x2 ∈ A tales que f (x1 ) = f (x2 ). Dado que g ◦ f = IA ,
     tendremos x1 = g(f (x1 )) = g(f (x2 )) = x2 , es decir, f es inyectiva.
1. f (X ∪ Y ) = f (X) ∪ f (Y ).
2. f (X ∩ Y ) ⊆ f (X) ∩ f (Y ).
3. X ⊆ Y =⇒ f (X) ⊂ f (Y ).
4. f (∅) = ∅.
1. f −1 (Y ∪ Z) = f −1 (Y ) ∪ f −1 (Z).
2. f −1 (Y ∩ Z) = f −1 (Y ) ∩ f −1 (Z).
3. f −1 (Y C ) = (f −1 (Y ))C .
                                               18
 4. Y ⊂ Z =⇒ f −1 (Y ) ⊂ f −1 (Z).
5. f −1 (B) = A.
6. f −1 (∅) = ∅.
 3. De ejemplos de funciones f y g, tales que una es inyectiva, la otra no, y tampoco sea
    inyectiva la compuesta g ◦ f .
 4. De ejemplos de funciones f y g, tales que una es sobreyectiva, la otra no, y tampoco sea
    sobreyectiva la compuesta g ◦ f .
                                              19
                                                                                 CAPÍTULO     2
Conjuntos Numéricos
En el capı́tulo anterior establecimos las bases de conjuntos y funciones necesarias para un desa-
rrollo moderno de las matemáticas. Vimos allı́ que los conjuntos pueden ser de una naturaleza
muy variada, incluyendo tanto objetos concretos como abstractos. En este curso estaremos
principalmente interesados en ciertos tipos de conjuntos abstractos, los llamados conjuntos
numéricos. Estos son los números naturales, enteros, racionales, reales, y complejos. Si bien ya
hemos usado en ejemplos del capı́tulo anterior los números naturales y los enteros, dado que
estos son conocidos desde etapas tempranas de la educación, en este capı́tulo los abordaremos
con más profundidad, resaltando sus propiedades fundamentales y cómo las preguntas naturales
sobre estos conjuntos nos conducen a la necesidad de expandirlos, llegando ası́ a los números
racionales, reales y complejos, fundamentales para la ingenierı́a. El material presentado en este
capı́tulo puede complementarse con ejercicios de los textos [2, 5, 8, 6]
N = {1, 2, 3, 4, . . .},
Con “tener familiaridad” queremos decir que sabemos manipular estos números, como por
ejemplo sumarlos, restarlos, multiplicarlos, etc. Además, que sabemos que tienen una conexión
con la realidad, por ejemplo que los naturales sirven para contar objetos, y que los enteros
negativos sirven para representar, por ejemplo, deudas.
                                                   20
    El objetivo de este capı́tulo es establecer propiedades fundamentales de estos conjuntos
numéricos e ilustrar cómo a partir de dichas propiedades fundamentales pueden desarrollarse
todo lo que en mayor o menor medida ya conocemos sobre ellos. Este ejercicio será importante
a medida que avancemos de estos conjuntos numéricos a los más sofisticados, como son los
racionales, los reales y los complejos.
    Comencemos con las operaciones básicas de adición y multiplicación que tenemos disponibles
en el conjunto de números enteros. Estas operaciones las podemos ver como funciones:
s : Z × Z → Z; m : Z × Z → Z,
Proposición 2.1.1. La suma y producto de números enteros satisfacen las siguientes propiedades:
                                                  21
 y producto, pero no lo demostraremos en este curso. Sin embargo, usaremos libremente todas
 las propiedades familaries de la potenciación.
     Dados dos números a, b ∈ Z, diremos que a es mayor que b si existe otro número c ∈ N
 tal que a = b + c. Denotaremos esta situación mediante el sı́mbolo a > b. En tal caso,
 también podemos decir que b es menor que a y escribir b < a. Cuando queremos considerar
 la posibilidad de que a = b, usaremos la notación a ≤ b, para indicar que a es menor o igual
 que b, o bien b ≥ a, para indicar que b es mayor o igual que a. A cualquiera de las relaciones
 “<” o “≤” la llamaremos relación de orden en Z.
     Observamos que la relación de orden en Z cumple las siguientes propiedades.
 Proposición 2.1.2.
a) Reflexividad: Par cualquier a ∈ Z, se tiene a ≤ a.
b) Antisimetrı́a: Si a ≤ b y b ≤ a, entonces a = b.
c) Transitividad: Si a ≤ b y b ≤ c, entonces a ≤ c.
d) Monotonı́a de la adición: Dados a, b ∈ Z, a ≤ b =⇒ a + c ≤ b + c para cualesquier c ∈ Z.
e) Monotonı́a de la multiplicación: Dados a, b ∈ N, a ≤ b =⇒ ac ≤ bc para cualquier c ∈ N.
b) Si a ≤ b y c ≤ d, entonces a + c ≤ b + d.
                                                 22
    Una de las propiedades más importantes de la relación de orden en Z es el llamado prin-
cipio del buen orden, que establece lo siguiente: todo subconjunto no vacı́o A ⊂ Z acotado
inferiormente admite un elemento mı́nimo. Es decir, existe un elemento am ∈ A tal que am ≤ a
para todo a ∈ A. Equivalentemente, puede decirse que todo subconjunto B ⊂ Z no vacı́o y
acotado superiormente admite un elemento máximo. Es decir, un elemento bM ∈ B tal que
bM ≥ b para todo b ∈ B.
Ejercicio 2.1.5. Dado A ⊂ Z no vacı́o y acotado inferiormente, explique por qué el elemento
mı́nimo es único.
Ası́, si n ≥ 0, tendremos n ≥ −n y por tanto |n| = n. Caso tengamos n < 0, entonces −n > n
y por tanto |n| = −n. En cualquier caso, |n| ≥ 0.
a) −|a| ≤ a ≤ |a|.
b) |a + b| ≤ |a| + |b|.
c) |ab| = |a||b|.
e) |a − b| ≤ |a − c| + |c − b|.
Prueba. Seguir la siguiente prueba es opcional, pero es una buena forma de familiarizarse
con las propiedades enunciadas, y las manipulaciones de desigualdades, las cuales usaremos
posteriormente.
  b) Observamos que −|a| ≤ a ≤ |a| y −|b| ≤ b ≤ |b|. Sumando miembro a miembro estas
     desigualdades, obtenemos
     Multiplicando por −1 la primera desigualdad obtenemos −(a + b) ≤ |a| + |b|, por tanto
     |a| + |b| es mayor o igual que el máximo entre a + b y −(a + b), esto es |a + b| ≤ |a| + |b|.
                                                  23
  c) Observamos primero que |x||x| = xx (por la regla de los signos). Entonces
Por tanto |ab| = ±|a||b|. Dado que ambos son positivos, concluimos que |ab| = |a||b|.
      Análogamente
                                        |b| − |a| ≤ |b − a| = |a − b|.
2.1.1     Divisibilidad
Dados dos enteros a, b ∈ Z, diremos que b es múltiplo de a si existe c ∈ Z tal que b = ac. En
este caso, diremos también que a y c son factores o divisores de b, o que a y c dividen a b,
y que b se factoriza como b = ac. Es usual la notación a|b para indicar que a divide a b.
Observación 9. Notemos que a = 0 no puede ser divisor de ningún entero b ̸= 0. Pues, para
serlo, deberı́a existir un entero c tal que b = 0c, lo cual es imposible. Por otra parte, si b = 0,
entonces para cualquier c ∈ Z se tendra 0 = 0c. De esta última igualdad, podemos concluir
que cualquier entero c divide a 0, y que 0 es múltiplo de cualquier entero. De esta forma, si
con la notación ab quisiéramos representar el entero c tal que b = ac, vemos que si b ̸= 0 y
a = 0, entonces ab no existe, y si a = b = 0, entonces ab puede ser cualquier entero. Por lo
general, estamos interesados en situaciones donde tenemos existencia de los objetos que nos
interesan, y frecuentemente queremos que sean únicos. Como a = 0 rompe cualquiera de estas
dos condiciones decimos que la división entre 0 no está definida. En adelante, en cualquier
resultado teórico en que un entero aparezca como divisor, entenderemos que debe ser no nulo.
                                                  24
donde q es entero, y por lo tanto p2 es impar.
  b) De a|b tenemos b = aq1 para algún q1 ∈ Z y de a|c tenemos c = aq2 para algún q2 ∈ Z.
     Entonces, dados m, n ∈ Z tenemos
Ejercicio 2.1.10. Dados enteros a, c1 , c2 , . . . , cr tales que a|ci , para todo i = 1, 2, . . . r, entonces
a divide a m1 c1 + m2 c2 + · · · + mr cr , para cualesquiera enteros mi .
   El siguiente resultado es uno de los más importantes sobre divisibilidad de los números
enteros.
                                                     25
Observemos primero que este conjunto es no vacı́o, pues a − bn > 0 es equivalente a a > bn,
lo cual podemos obtener eligiendo apropiadamente n ∈ Z. Además, el conjunto R es acotado
inferiormente por 0. Por tanto, del principio del buen orden, sigue que R tiene un elemento
mı́nimo, que llamaremos r.
    En particular, existe un número q tal que r = a − bq ∈ R y es mı́nimo. De esta igualdad
obtenemos a = bq + r, y además r es único, pues es el mı́nimo del conjunto R.
    Si r ≥ |b| tendrı́amos r = |b| + p, con p ∈ N. Consideremos dos casos
a − b(q + 1) = a − bq − b = r − b = p > 0,
bq + r = bq ′ + r =⇒ bq = bq ′ =⇒ q = q ′ .
M CD(n1 , n2 , . . . , nr )
para denotar el máximo común divisor de los ni . Dos números enteros a y b se denominan
primos relativos si su máximo común divisor es 1.
   Notemos que dados n1 , n2 , . . . , nr , no todos nulos, podemos asumir que están ordenados
como |n1 | < |n2 | < · · · < |nr |. Si denotamos por D el conjunto de números naturales que son
                                                     26
factores comunes de los ni , observamos que D está acotado superiormente por |nr |, y además
que D es no vacı́o, pues 1 ∈ D. El principio del buen orden implica por tanto la existencia de
un elemento máximo en D. Dicho elemento será pues el máximo común divisor de los ni .
    Veremos a continuación un método computacionalmente eficiente para el cálculo del máximo
común divisor de dos enteros. El método se conoce como el Algoritmo de Euclides, y se basa
en el siguiente resultado.
    Antes de ver la prueba de este resultado, veamos cómo se usa para construir el Algoritmo de
Euclides. Para simplificar la discusión, supongamos que a y b son positivos. Si b es divisor de
a, entonces M CD(a, b) = b. Caso contrario, tendremos a = bq + r, con 0 < r < b, y el Teorema
implica, en particular, que M CD(a, b) = M CD(b, r). Entonces, si r divide a b, tendremos
r = M CD(b, r) = M CD(a, b). Caso contrario, tendremoss b = rq1 + r1 , con 0 < r1 < r, y de
nuevo por el teorema precedente, M CD(r, r1 ) = M CD(b, r) = M CD(a, b). Prosiguiendo de
este modo, obtenemos una secuencia decreciente r > r1 > r2 > · · · ≥ 0, tal que
Dado que los ri están acotados por 0, eventualmente la secuencia deberá finalizar, y el último
resto no nulo será el máximo común divisor buscado.
                                               27
y c es factor común de a y b.
Teorema 2.1.14 (Identidad de Bezout). El máximo común divisor de dos números enteros a
y b, no ambos nulos, es el menor número natural d que puede escribirse como d = ma + nb,
con m y n enteros.
Primero observamos que D es no vacı́o, pues 0 < |a| = ±1 · a + 0 · b ∈ D, y además está acotado
inferiormente por 1. Del principio del buen orden, este conjunto tiene un menor elemento, que
llamaremos d. Afirmamos que d es el máximo común divisor de a y b.
    En efecto, pongamos d = ma+nb. Del algoritmo de la división, podemos escribir a = dq +r,
con 0 ≤ r < d, y por lo tanto
Observación 10. En la práctica se pueden determinar los números m y n del teorema prece-
dente invertiendo los pasos en el Algoritmo de Euclides. Por ejemplo, retomando el Ejemplo
2.1.13, tenemos:
                                               28
    Por tanto, M CD(d2 , a3 ) = p(ma1 + na2 ) + qa3 = pma1 + pna2 + qa3 , y dado que d3 divide
los ai , entonces divide a M CD(d2 , a3 ) (Ejercicio 2.1.10). Por otro lado, M CD(d2 , a3 ) divide
a d2 y a a3 . Del hecho que divide a d2 , y d2 divide a a1 y a2 sigue que M CD(d2 , a3 ) divide a
a1 y a a2 . Ası́, M CD(d2 , a3 ) es un divisor común de a1 , a2 y a3 . Por tanto también es divisor
de d3 . Concluimos que d3 = M CD(d2 , a3 ).
Ejercicio 2.1.16. Generalice el argumento dado en el ejemplo anterior. Esto es, dados enteros
a1 , . . . , ar , ponga dk = M CD(a1 , a2 , . . . , ak ), y muestre que dr = M CD(dr−1 , ar ).
Observación 11. El ejercicio anterior sirve para calcular el MCD de varios enteros aplicando
de forma recursiva el algoritmo de Euclides para el cálculo del MCD de dos enteros.
Proposición 2.1.17 (Lema de Euclides). Dados a y b enteros, y p un número primo que divide
al producto ab, entonces p es factor de a o es factor de b.
Prueba. Dado que p es divisor de ab, entonces podemos escribir ab = kp, para algún entero
k. Supongamos que p no divide alguno de los enteros a y b, digamos a. Entonces el máximo
común divisor de p y a es 1, y por lo tanto tendremos 1 = mp + na, para ciertos enteros m y
n. Multiplicando esta igualdad por b, obenemos
es decir, p es un factor de b.
Corolario 2.1.18. Dados enteros a, b, p, con p y a primos relativos, y p|ab, entonces p|b.
M CM (a1 , . . . , ar ),
como el menor entero positivo que es múltiplo de todos los ai . La existencia del mı́nimo común
múltiplo es una consecuencia simple del principio del buen orden, pues, |a1 ||a2 | · · · |ar | es un
múltiplo común positivo de los ai , y por tanto el conjunto M de todos los múltiplos comunes
positivos de los ai es no vacı́o, y acotado inferiormente por 1, por lo cual tiene un (único) menor
elemento, el cual será M CM (a1 , . . . , ar ).
    En la siguiente proposición estableceremos la relación entre el máximo común divisor y el
mı́nimo común múltiplo. Para su prueba será necesario el resultado del siguiente ejercicio.
                                                  29
Ejercicio 2.1.19. Dados dos números enteros, a y b, suponga que |a| = rd y |b| = sd, siendo
d = M DC(a, b). Muestre que r y s son primos relativos.
Prueba. Pongamos d = M CD(a, b) y m = M CM (a, b). Tenemos que d divide a |a| y a |b|,
por tanto podemos escribir |a| = rd y |b| = sd, siendo r y s primos relativos (Ejercicio 2.1.19).
Como m es múltiplo común de |a| y |b|, podemos escribir p|a| = m = q|b|, de donde obtenemos
Ası́, q = rk, y por lo tanto m = q|b| = rk|b|. Es decir, r|b| = rsd es un factor de m. Por otro
lado, rsd es divisible por rd = |a| y por sd = |b|, es decir, es múltiplo común de |a| y b, con lo
cual es múltiplo de m. Concluimos que m = rsd, y por lo tanto
como querı́amos.
    Cerraremos esta sección usando el Lema de Euclides par demostrar el Teorema Fundamental
de la Aritmética, también conocido como Teorema de la Factorización Prima, el cual establece
que todo número natural mayor que 1 o bien primo, o bien es producto de números primos.
Prueba. Consideremos un entero a > 1. Si a es primo, ya no hay nada que demostrar. Caso
contrario, tendrá factores no triviales, y podremos esccribir a = q1 q2 · · · qr , donde 1 < qi < a,
para cada i = 1, 2, . . . r. Si todos los qi son primos, ya tendremos a como producto de primos.
Caso contrario, cualquiera de los qi que no sea primo, será producto de factores no triviales y
menores. Si estos factores son primos, ya tenemos lo que buscamos, caso contrario, continuamos
expresándolos como producto de factores no triviales, cada vez menores. Este proceso debe
terminar en una cantidad finita de pasos, pues todos los factores que surgen están limitados
inferiormente por 1. Esto garantiza que a, si no es primo, será el producto de factores primos.
    Consideremos ahora que
                                              a = q1 q2 · · · qr
a = p 1 p1 · · · ps
                                                  30
sea otra descomposición en factores primos. Entonces, de
p1 p2 · · · ps = q1 q2 · · · q r ,
p2 · · · ps = q2 · · · q r .
                                                    31
    El conjunto de los números racionales lo definiremos mediante
                                      nm                     o
                                Q :=      ; m, n ∈ Z; n = ̸ 0 ,
                                        n
                                             m n   mq + np
                                               + =         ,
                                             p  q    pq
y
                                                m n  mn
                                                 · =
                                                q p  pq
                            m                                                    −m
    Dado un elemento        n
                                ∈ Q, su negativo es el elemento − m
                                                                  n
                                                                    =             n
                                                                                      =   m
                                                                                          −n
                                                                                             .
Observación 13. Observemos que para cualquier entero m ∈ Z, podemos considerar la igualdad
m = m1 . Esta identificación nos permite pensar en Z como un subconjunto de Q, y en particular,
tenemos 0 ∈ Q y 1 ∈ Q. Las operaciones de suma y producto de Q cuando se aplican a los
elementos de Z, coinciden con las que ya tenı́amos para Z. Con estas definiciones se tienen
todas las propiedades familiares de suma y producto de fracciones, incluidas la resta y la regla
de los signos.
    La diferencia principal entre Q y Z es que ahora podremos definir la división de tal forma
que el resultado de dividir dos elementos de Q siempre será otro elemento de Q. Para ello,
es importante introducir el concepto de inverso multiplicativo. Concretamente, comenzamos
observando que 1 ∈ Q sigue siento el neutro multiplicativo, pues 1 = 11 =⇒ 1 · mn
                                                                                  =m n
                                                                                       . Ahora,
dado un elemento no nulo z ∈ Q, definimos su inverso multiplicativo, o su recı́proco, como
el elemento de z −1 ∈ Q tal que
                                          z · z −1 = 1.
                                              m n   mn
                                               ·  =    = 1.
                                              n m   nm
  Ahora, dados dos elementos r, z ∈ Q, con z no nulo, definimos la división de r entre z
mediante
                                    r ÷ z := r · z −1 .
    Ası́, si r =   m
                   n
                       y z = pq , entonces
                                             m p   m q  mq
                                               ÷ =  · =
                                             n  q  n p  np
                                                        32
Observación 14. Usaremos, como es usual, la notación r ÷ z = zr = r/z. Ası́, la notación
fraccionaria indicará tanto la operación de división, como un elemento genérico del conjunto
Q de forma explı́cita.
   Ası́, tenemos en Q las cuatro operaciones básicas, a a saber: suma, resta, multiplicación y
división. Estas operaciones satisfacen todas las propiedades usuales, las cuales por sofisticadas
que sean, son consecuencias de las siguientes propiedades fundamentales, que listaremos aquı́ a
modo de referencia en una Proposición.
Proposición 2.2.1. Las operaciones de suma y producto en Q satisfacen las siguientes propiedades.
a + (−a) = 0.
a · (b + c) = a · b + a · c.
Observación 15. Note que estas 9 propiedades son todas conocidas de la manipulación usual
de números fraccionarios. Lo importante aquı́, más que memorizarse estas propiedades, es el
hecho de que todas las propiedades de los números racionales son consecuencias lógicas de estas
propiedades fundamentales. Por ejemplo, a partir de ellas se puede demostrar que en Q son
válidas las leyes de corte
a + b = a + c =⇒ b = c ab = ac =⇒ b = c si a ̸= 0.
Observación 16. La propiedad distributiva puede verse también como una factorización. Es
decir, en la igualdad
                                a · (b + c) = a · b + a · c,
                                                   33
podemos pensar que, al ir de izquierda a derecha de la igualdad, estamos distribuyendo el pro-
ducto sobre la suma. Pero si pensamos que vamos del lado derecho al lado izquierdo de la
igualdad, estamos factorizando al extraer el factor común a. La propiedad distributiva es útil
para realizar cálculos, por ejemplo, consideremos el cálculo de 13 · 17. Podemos realizar lo
siguiente
    Con la extensión de los enteros a los racionales ganamos también la posibilidad de expandir
el concepto de potenciación. Recordemos que, si a es entero, hemos definido a0 = 1, y si n es
natural, entonces
                                            an = aa · · · a,
con n factores iguales a a. En los enteros no tenı́a sentido plantearse un exponente negativo.
Ahora, si a es un racional, y n es un natural, podemos definir
                                                                1        1
                         a0 = 1;     an = aa · · · a;   a−n =     n
                                                                    =            ,
                                                                a     aa · · · a
donde los productos indicados tienen n factores iguales a a. Con esta definción, se cumplen
todas las propiedades usuales de la potenciación de fracciones, que listamos en la siguente
Proposición a modo de referencia
  a) am an = am+n
       am
  b)   an
            = am−n .
c) (am )n = amn
  d) (ab)n = an bn
       n     n
  e) ab = abn
                                                                    p
Prueba. Probemos d) a modo de ejemplo. En efecto, a =               q
                                                                        y b = rs , con lo cual, si n es un
entero positivo, tendremos
                                 n  n
                           n   pr       pr       pr      pq
                       (ab) =        =       =      · · · , n factores
                               qs       qs       qs      rs                                          (2.1)
                              p p    p r r     r
                            = · · · · · · · · · = an bn .
                              q q    q s s     s
Si n es negativo, tendremos
                                         1      1        1 1
                           (ab)n =           =        =         = an b n .
                                      (ab)−n   an b n   a−n b−n
                                                   34
 Ejercicio 2.2.3. Pruebe las demás propiedades listadas en la Proposición 2.2.2.
     La relación de orden que tenemos en los enteros puede extenderse a una relación de orden
 en los racionales, de la siguiente forma. Dados dos racionales m/n y p/q, declaramos que m/n
 es mayor que p/q si se cumple
                                             mq > np.
mq ≥ np,
 es decir.
     Notemos que, si z1 , z2 ∈ Z, entonces podemos pensarlos como racionales con denominador
 1, es decir z1 = z1 /1 y z2 = z2 /1, y tendremos
z1 /1 ≥ z2 /1 ⇔ z1 · 1 ≥ 1 · z2 ⇔ z1 ≥ z2 .
 Esto muestra que nuestra definición del orden en Q es compatible con el que tenı́amos en Z. Y
 con esta definición, la relación de orden en Q satisface las siguientes propiedades.
 Proposición 2.2.4.
a) Reflexividad: Par cualquier a ∈ Q, se tiene a ≤ a.
b) Antisimetrı́a: Si a ≤ b y b ≤ a, entonces a = b.
c) Transitividad: Si a ≤ b y b ≤ c, entonces a ≤ c.
d) Monotonı́a de la adición: Dados a, b ∈ Q, a ≤ b =⇒ a + c ≤ b + c para cualesquier c ∈ Q.
e) Monotonı́a de la multiplicación: Dados a, b ∈ Q, a ≤ b =⇒ ac ≤ bc para cualquier c ∈ Q
 positivo.
    Del mismo modo como usamos la relación de orden en Z para introducir el concepto de valor
 absoluto, lo podemos hacer ahora en Q, y serán válidas las mismas propiedades enunciadas en la
                                                35
Proposición 2.1.6. Haremos notar aquı́ simplemente que, si a = m/n ∈ Q, entonces tendremos
                                               m  |m|
                                        |a| =   =     .
                                               
                                                n   |n|
    Hemos visto hasta ahora que los números naturales, enteros y racionales surgen como abs-
tracción matemática en respuesta a necesidades prácticas como contar y comerciar. En el
fondo de todas estas actividades humanas se encuentra el concepto de la medición, el cual es
fundamental para el desarrollo de la ciencia. Desde la antigua Grecia, los números han sido
asociados con mediciones geométricas, y veremos que esto una vez más conduce a la necesidad
de expandir nuestro sistema numérico.
    Consideremos un cuadrado de lado 1, y sea d su diagonal. El teorema de Pitágoras asegura
que d2 = 12 +12 = 1+1 = 2. Ası́, el número que deberı́amos asociar a la longitud de la diagonal
de un cuadrado de lado unitario debe ser tal que su cuadrado sea igual a 2. Argumentaremos
ahora que en Q no existe ningún elemento que cumpla dicha condición.
    En efecto, consideremos un elemento arbitrario p/q ∈ Q, el cual podemos suponer que fue
reducido a su mı́nima expresión, es decir, con p y q primos relativos (en particular, no pueden
ser ambos pares). Supongamos que este número racional satisface que su cuadrado es 2, es
decir, 2 = (p/q)2 = p2 /q 2 . De aquı́ obtenemos
2q 2 = p2 .
Esto significa que p2 es par, y por lo tanto debemos tener p par (Ejemplo 2.1.7). Pongamos
p = 2m. Entonces obtenemos
2q 2 = 4m2 =⇒ q 2 = 2m2 ,
con lo cual concluimos que también q 2 y q deben ser pares. Pero esto contradice que p y q sean
primos relativos.
   De esta forma, si hemos de asignar un número a la longitud de la diagonal de nuestro
cuadrado de lado unitario, dicho número no puede ser ningún elemento de Q.
                                                36
                           Figure 2.1: Representación de la recta real
unidad. Hecho esto, podemos colocar los racionales de la siguiente forma: dado un racional
m/n, observamos que es lo mismo que m · n1 , entonces se divide la longitud unidad en n partes
iguales y se toman m de dichos segmentos partiendo desde el 0 (el signo del racional indica
hacia donde nos desplazamos del 0). Esto permite identificar cada racional con un punto de la
recta numérica, pero como hemos visto, existen longitudes de segmentos que no se corresponden
con ningún racional (ver Figura 2.1). A los puntos de la recta que tienen esta caracterı́stica de
no poder ser representados por un racional los llamaremos números irracionales. A la unión
de los números racionales y los irracionales los llamaremos números reales, y lo denotaremos
mediante R.
    Nuestro primer ejemplo de un número irracional es la diagonal del cuadrado unitario, que
como hemos visto es una cantidad cuyo cuadrado debe ser 2. La notación usual para dicha
             √
cantidad es 2, y se conoce como la raiz cuadrada de 2. El cociente entre la longitud de una
circunferencia y su diámetro, usualmente denotado como π también es un número irracional,
                                                           √
aunque demostrarlo no es tan sencillo como el caso de 2. Otras cantidades importantes que
son irracionales serán estudiadas en cursos de cálculo.
    Si bien los racionales no son suficientes para representar todas las cantidades que pueden
tener un significado geométrico, algo interesante es que sı́ sirven para aproximar esas cantidades
con cualquier nivel de precisión que deseemos. La forma intuitiva de ver eso es que tomando n
suficientemente grande, podemos hacer que el racional 1/n sea tan pequeño cuanto queramos,
y con el segmento de longitud 1/n podemos desplazarnos del 0 tantas veces como sea necesario
                                                37
hasta aproximar cualquier punto de la recta real con un error menor que 1/n.
Observación 17. El proceso de aproximar una cantidad irracional mediante un número racional
es un caso particular del proceso conocido como lı́mite, el cual será estudiado en los cursos de
cálculo.
d(a, b) = |a − b|.
                                                38
2.2.2     Operaciones básicas con números reales
Puede demostrarse que las operaciones básicas de los racionales: suma, resta, multiplicación, y
división, pueden extenderse al conjunto de los números reales, y satisfacen también todas las
propiedades listadas en la Proposición 2.2.1, simplemente cambiando Q por R.
     La operación de potenciación también puede extenderse a los reales, tanto permitiendo
que las bases sean números reales, ası́ como permitiendo que los exponentes sean números
reales. Ninguna de estas extensiones son simples de definir, pero dejaremos asentado que,
en la Proposición 2.2.2, todas las propiedades siguen válidas si se permite que las bases sean
números reales, en tanto que los exponenetes permanezcan siendo enteros. Cuando a y b son
reales, la notación ab indica simplemente el cociente de dividir a entre b, y no necesariamente
es un número racional (recuerde que para que a/b sea racional, lo importante es que a y b sean
números enteros).
     Por otro lado, si permitimos que los exponentes sean números reales, las cosas tienen una
mayor sutileza. De hecho, tan solo permitiendo que los exponentes pasen de ser enteros a ser
racionales ya nos conducirá a problemas si la base es negativa, y nos llevará una vez más a la
necesidad de extender nuestro conjunto numérico más alla de R. De momento consideraremos
sólamente la potenciación con exponente racional (o real) para bases no negativas. En estas
condiciones, siguen siendo válidas las propiedades listadas en la Proposición 2.2.2.
     La potenciación con exponente racional está estrechamente ligada al concepto de radicación.
En efecto, para un r ∈ Q, podemos definir la r-ésima raı́z de un número a ≥ 0 como
                                           √
                                           r
                                               a := a1/r .
                                √                                    √
    De esta forma, vemos que ( r a)r = (a1/r )r = ar/r = a. Es decir r a es el número que elevado
a la r-ésima potencia es igual a a. Esta definición puede extenderse a r ∈ R, pero se requiere
un proceso de lı́mite que no tenemos disponible en este punto.
                                                                      √
Observación 19. Notemos que, si r = 2, y a = −1, tendı́amos que 2 −1 = (−1)1/2 deberı́a ser
tal que su cuadrado sea igual a −1. Ningún número real puede satisfacer eso, pues el cuadrado
de un número real siempre es positivo. Esto muestra porqué nos restringimos por ahora a bases
positivas. Si permitimos que la base a sea negativa, todavı́a podemos definir su raiz r-ésima
                                            √
para r ∈ N impar, mediante la condición ( r a)r = a, sin embargo, no podremos hacerlo para el
caso de r par. Lo que estamos viendo es que R no es un conjunto numérico lo suficientemente
amplio para la operación de radicación (o potenciación con exponente real).
    Con la definición de radicación que hemos adoptado es simple verificar las siguiente propiedades
(simplemente expréselo en forma de potencia y aplique las propiedades de la potenciación)
                                                 39
                 √
                 r a
       r a
       p
  b)     b
             =   r .
                 √
                   b
     p√       √
  c) r s a = rs a.
     √
  d) r ar = a
Prueba. Ejercicio.
    En la notación loga b, al número a se lo llama base del logaritmo. Algunas bases aparecen
con más frecuencia que otras en las aplicaciones. La primera es a = 10, en cuyo caso se suele
omitir la indicación explı́cita de la base, y se escribe log1 0b = log b. Este caso se conoce como
el logaritmo común. El segundo caso es a = e, donde e es un número irracional conocido
como el número de Euler, y cuyo valor approximado es 2.71. En este caso se usa la notación
loge b = ln b, y se lo conoce como el logaritmo natural o el logaritmo neperiano, en honor
al matemático escocés John Napier, a quien se acredita la introducción de los logaritmos.
    A continuación, listamos las propiedades fundamentales de la logaritmación.
a) loga 1 = 0.
b) loga a = 1.
c) loga ax = x
d) aloga x = x
                                                  40
  g) loga bc = c loga b.
                logc b
  h) loga b =   logc a
                       .
  e) Tenemos, por el ı́tem d), que aloga b+loga c = aloga b aloga c = bc. Luego, por definición tenemos
     loga bc = r = loga b + loga c.
                                    aloga b
  f) Tenemos aloga b−loga c =       alogb c
                                              = cb . Entonces, por definición, loga cb = loga b − loga c.
                                                                                         logc b
                           x = logc aloga b = loga b · logc a = logc b =⇒ loga b =              .
                                                                                         logc a
Observación 20. Las propiedades e), f ) y g) son las que han motivado históricamente el
estudio de los logaritmos, pues, en una época sin calculadoras digitales, permitı́a simplificar
los cálculos, convirtiendo productos y cocientes en sumas y potencias a productos. La última
propiedad indica que, si sabemos cómo calcular los logaritmos en una base dada, digamos en
base c, entonces podemos calcular en cualquier otra base a. A esta propiedad se la conoce como
cambio de base.
                                                          41
Observación 21. Uno puede plantearse la cuestión de porqué querrı́amos hallar dicho número,
pues si en R no existe, es plausible pensar que esta ecuación no tiene ninguna conexión con
nuestra realidad. Desde un punto de vista puramente matemático, uno de hecho no da énfasis
aquı́ a la noción de número. Desde este punto de vista, la cuestión es simplemente la siguiente:
Existe un objeto matemático, susceptible de ser multiplicado por sı́ mismo y que de como re-
sultado el negativo de la unidad en R? Por otro lado, históricamente la necesidad de resolver
x2 = −1 de hecho surgió como parte de los procesos para resolver cuestiones planteadas sobre los
números reales y con soluciones en los números reales. Concretamente, el estudio de las ecua-
ciones polinomiales cúbicas, realizada por Tartaglia, Cardano, entre otros, a mediados del siglo
XV I, con soluciones reales, de una forma inexplicable para la época, conducı́a a la manipu-
                               √
lación de expresiones como −1. Finalmente, muchos años después de que los matemáticos
                                                          √
comenzaron a estudiar las propiedades de objetos como −1, resulta que el mismo se torna una
herramienta indispensable en las ciencias y la ingenierı́a, y aparece ligada de forma intrı́nseca
en la formulación matemática de la teorı́a cuántica, una de las teorı́as cientı́ficas más exitosas
que tenemos.
Observación 22. Una forma de recordar la regla de multiplicación compleja es pensando que
todos los sı́mbolos en a + ib y c + id son reales, y aplicar la distributividad del producto de reales,
pero recordando la regla adicional de que i2 := −1. También es usual hacer las identificaciones
a + 0i = a y 0 + bi = bi. El primer caso, permite ver el conjunto R como un subconjunto de C,
y se dice que el número complejo es “real”, aunque técnicamente esto no sea ası́. En el segundo
caso, se dice que el número complejo es “imaginario puro”.
Ejemplo 2.3.1. Veamos algunos ejemplos concretos. Supongamos que z1 = 3+2i y z2 = 4−5i.
Entonces
                                                  42
y
Proposición 2.3.2. La suma y producto de números complejos satisfacen las siguientes propiedades.
zz −1 = 1 + 0i = 1.
Prueba. Ejercicio.
                                                  43
   La existencia de los opuestos aditivos e inversos multiplicativos, para los elementos no nulos,
permiten definir en C la resta y la división, de la misma forma como lo hemos hecho en Q, a
saber: dados dos complejos z1 y z2 definimos
z1 − z2 := z1 + (−z2 ),
y si z2 es no nulo, entonces
                                                  z1
                                                     := z1 z2−1 .
                                                  z2
     En particular, se puede demostrar a partir de la asociatividad, que las leyes de corte son
válidas en C, es decir:
z1 + z2 = z1 + z3 =⇒ z2 = z3 ; z1 z2 = z1 z3 =⇒ z2 = z3 si z1 es no nulo.
También es consecuencia de la asociatividad la regla de los signos. Ası́, todas las manipulaciones
algebraicas con los números reales son válidas con números complejos, teniendo en cuenta que
a la hora de realizar las operaciones, se deben respetar las definiciones dadas en la ecuación
(2.4).
Observación 23. Algo relevante es que en los complejos C no podemos extender la relación
de orden que tenemos en R. Esto tiene que ver con algo más fundamental, que establece que R
es “esencialmente” el único cuerpo ordenado completo1 . Aquı́, “cuerpo” significa básicamente
que se tienen las 4 operaciones básicas (suma, resta, multiplicación y división), “ordenado”
significa que existe una relación de orden, y “completo” tiene que ver con el hecho de que no hay
“huecos”, lo cual hemos visto intuitivamente con la recta numérica real. Resulta que C también
es un cuerpo y también es completo, y por tanto si tuviera un “orden”, serı́a “esencialmente”
igual a R, pero no lo es. Por tanto, no puede tener una relación de orden.
                                                        44
                               Figure 2.2: Diagrama de Argand
z := a − bi.
y su módulo mediante
                                                  √
                                         |z| :=       a2 + b 2 .
En el diagrama de Argand, z serı́a el reflejo especular de z respecto del eje Re, y |z| serı́a la
longitud del segmento de recta que conecta el origen con el punto (a, b).
Observación 24. Notemos que podemos pensar en la conjugación como una función que va de
C a C y en el módulo como una función que va de C a R. Esta visión en términos de funciones
será más relevante a medida que incursionemos en cursos más avanzados.
a) z = z.
b) z + w = z + w; z · w = z · w.
                                                  45
  c) z + z = 2Re(z).
e) |z| = |z|.
f ) |zw| = |z||w|.
g) Re(z) ≤ |z|.
i) |z + w| ≤ |z| + |w|
Prueba. Los primeros 5 ı́tems quedan como ejercicios. Probemos los demás ı́tems.
f) Dado z = a + bi, y w = c + di, tenemos zw = (ac − bd) + (ad + bc)i, y por tanto
                        |z + w|2 = zz + zw + wz + ww
                                  = |z|2 + |w|2 + zw + zw = |z|2 + |w|2 + 2Re(zw)           (2.6)
                                  ≤ |z|2 + |w|2 + 2|zw| = (|z| + |w|)2 .
                                                   46
2.3.1     Representaciones de números complejos
La forma en que hemos introducido los números complejos, a saber a + bi, se conoce como
la forma rectangular o forma cartesiana, debido a la posibilidad de identificar el número
complejo a + bi con el par ordenado (a, b) en el diagrama de Argand. Veremos ahora otras
formas de representar el número complejo z = a + bi, haciendo uso del módulo |z| y del ángulo
φ (Ver Figura 2.2).
    Comencemos estableciendo una criterio para medir ángulos en el diagrama de Argand.
Tomaremos como referencia el eje Re positivo, y a partir de allı́ consideraremos que una rotación
en sentido antihorario corresponderá a un ángulo positivo y una rotación en sentido horario
corresponderá a un ángulo negativo.
    De esta forma, vemos que
                                              a = |z| cos φ,
                                                                                             (2.7)
                                              b = |z| sin φ.
que se conoce como la forma polar o forma trigonométrica, del número complejo z.
    El ángulo φ recibe el nombre de argumento. Observemos Dicho valor no queda unı́vocamente
dererminado por z = a + bi, pues las funciones trigonométricas tienen una periodicidad de
2nπ, con n entero. Por tal motivo, se denomina arg(z) al conjunto de todos los valores de
φ = arctan(b/a) y Arg(z) al valor que pertence al intervalo (−π, π]. Al valor Arg(z) se lo
llama argumento principal del número complejo z = a + bi. Ası́, tenemos
y
                                      w = |w| cos θ + i|w| sin θ,
Usaremos el sı́mbolo eiφ para denotar el número complejo cos φ + i sin φ, lo cual nos permite
                                                   47
escribir el número complejo z = a + bi = |z|(cos φ + i sin φ) en la llamada forma exponencial:
z = |z|eiφ .
Observación 26. De momento eiφ es para nosotros apenas un sı́mbolo que representa al número
complejo cos φ + i sin φ, sin embargo, la notación no es accidental. En cursos más avanzados
veremos que puede definirse la función exponencial compleja, y la igualdad eiφ = cos φ + i sin φ,
siendo e el número de Euler, es conocida como la identidad de Euler, y es uno de los
resultados fundamentales del análisis complejo.
   Las formas polar y exponencial son especialmente interesantes para realizar productos y
divisiones de números complejos. Veamos por qué. Supongamos que tenemos dos números
complejos z = |z|eiφ y w = |w|eiθ . Entonces, podemos escribir
y por lo tanto
donde hemos usado las identidades trigonométricas estándares de coseno y seno de la suma de
arcos.
   Por otro lado, observemos que
Y por lo tanto, e−iφ es el inverso multiplicativo de eiφ . De esto sigue que si z = |z|eiφ es un
                                   1 −iφ
complejo no nulo, entonces z −1 = |z| e , pues tenemos
Vemos ası́ que las multiplicaciones y divisiones de complejos se realizan de forma mucho
                                                     48
más eficiente usando la representación exponencial.
   Observemos, para cerrar esta sección, que si z = |z|eiφ , entonces z n = |z|n einφ , para
cualquier entero z.
Vemos que el argumento que obtenemos para zw sumando los argumentos principales de z y
w es un valor mayor que π, y por lo tanto no es el argumento principal de zw. Es decir, en
general no se tiene la igualdad Arg(zw) = Arg(z) + Arg(w). Para obtener Arg(zw), debemos
sumar algún múltiplo entero de π al valor 13π/12 de tal forma a obtener un valor en el intervalo
(−π, π]). En este caso, tenemos
                                                         13           11
                                     Arg(zw) =              π − 2π = − π.
                                                         12           12
                                     1/n
    Es usual usar la notación z0 para denotar el conjunto completo de las raı́ces n-ésimas
                                                                           1/n
del complejo z0 . Cuando z0 = r0 ∈ R, es un real positivo, el sı́mbolo r0 denota también
                                                                 √
el conjunto completo de raı́ces de r0 , en tanto que el sı́mbolo n r0 se reserva para la única
                                                              49
                                                                            φ0
raı́z positiva. También, cuando φ0 = Arg(z0 ), entonces a c0 = n |z0 |ei( n ) se lo llama raı́z
                                                                          p
principal.
     Un caso de especial importancia es cuando z0 = 1 = ei0 . Entonces, dado n ∈ N, los números
complejos
                                        2kπ
                               ck = ei( n ) ; k = 0, 1, 2, . . . , n − 1,
                                              50
                                                                                CAPÍTULO        3
En este capı́tulo realizaremos un estudio de las expresiones algebraicas. Entenderemos por ex-
presión algebraica una combinación finita de las operaciones básicas, incluyendo la potenciación
(base variable con exponente constante) y la radicación (exponente racional). Sin embargo, en
esta categorı́a no entrará la logaritmación ni la exponenciación (exponente variable).
    De entre las expresiones algebraicas, el objeto más simple es el polinomio, y le dedicaremos
la primera parte de este capı́tulo. Asumiremos que se tiene familiaridad con las manipula-
ciones básicas con polinomios, como son la suma, resta, multiplicación, división, factorización
y cálculo de mı́nimo común múltiplo y máximo común divisor de polinomios. De esa forma,
nos centraremos en establecer propiedades fundamentales de los polinomios, haciendo un par-
alelismo con resultados válidos en los enteros. En la parte final del capı́tulo, estableceremos
la conección entre las expresiones algebraicas con las funciones, y en dicho contexto estudiare-
mos las funciones polinomiales, las racionales y las irracionales. El estudio de estas funciones
es fundamental para los cursos de cálculo. El contenido desarrollado en esta unidad puede
complementarse, especialmente para ejercicios, con los textos [9, 10].
3.1      Polinomios
Un polinomio en x es una expresión de la forma
                                                 51
polinomios, los coeficientes deben pertenecer a algún conjunto donde podamos sumar y mul-
tiplicar. Sabemos que podemos hacer eso en cualquiera de los conjuntos N, Z, Q, R y C, pero
también se puede hacer en otros conjuntos que aún no hemos visto, pero serán importantes
pronto en cursos más avanzados. Por el momento, nosotros estaremos interesados principal-
mente en dos casos, a saber: que los coeficientes sean reales (ai ∈ R) o que los coeficientes sean
complejos (ai ∈ C).
Observación 27. Notemos que si todos los coeficientes son, por ejemplo enteros, del hecho
que tenemos las inclusiones Z ⊂ Q ⊂ R ⊂ C, podemos siempre suponer que los coeficientes son
complejos. El punto es que la restricción sobre los coeficientes puede tener repercusiones en las
propiedades de los polinomios. Veremos un caso concreto de esto en breve.
2x3 + 3x + 2 ∈ R[x]
y
                                      (3 + 2i)x2 + 5 ∈ C[x].
Notemos que de R ⊂ C, sigue que también podemos pensar en R[x] como subconjunto de C[x].
    Cuando no queremos especificar si los coeficientes son reales o complejos, o queremos discutir
propiedades que son válidas en cualquier caso, usaremos la notación K para representar tanto
a R como a C. Ası́, K[x] es el conjunto de todos los polinomios en x con coeficientes ya sean
reales o complejos.
    Si denotamos por p un elemento de K[x], entenderemos que para algún n ∈ N se tiene
p = pn xn + pn−1 xn−1 + · · · + p1 x + p0 ,
q = qm xm + pm−1 xm−1 + · · · + q1 x + q0 ,
con qm no nulo.
                                                 52
    Sabemos que estos polinomios pueden sumarse, y que el polinomio 0, que tiene todos sus
coeficientes iguales a cero es neutro para la adición, y nos permite definir el opuesto de un
polinomio p. En efecto, tenemos
y como sabemos
                                          p + (−p) = 0.
Teorema 3.1.1 (Algoritmo de la división para polinomios). Dados dos polinomios f y g, tal
que g ̸= 0, entonces existen dos únicos polinomios q y r tal que
f = gq + r,
R = {f − gp; p ∈ K[x]}.
   Si 0 ∈ R, entonces f = gp, lo cual significa que g divide a f , con cociente p y resto nulo.
En este caso ya no hay nada que probar.
                                                53
    Caso contrario, los grados de los elementos de R conforman un subconjunto no vacı́o de los
naturales, y por lo tanto admiten un elemento mı́nimo, digamos m. Sea r ∈ R un polinomio
cuyo grado es este mı́nimo m. Dicho polinomio es de la forma r = f − gq, con q ∈ K[x], y por
lo tanto tenemos
                                           f = gq + r.
r = rm xm + rm−1 xm−1 + · · · + r1 x + r0
y
                             g = gn xn + gn−1 xn−1 + · · · + g1 x + g0 ,
con lo cual se contradice la minimalidad del grado m. Por tanto, debemos tener m < n, esto
es, deg(r) < deg(b).
    Falta ver la unicidad de los polinomios q y r. Para ello, supongamos que r̃ y q̃ son otro par
de polinomios que satisfacen las condiciones dadas, entonces tenemos
gq + r = f = g q̃ + r̃,
Si esta igualdad no es nula, entonces el polinomio de la derecha tiene grado menor o igual que
m, que s su vez es menor que deg(g) en tanto que el polinomio de la izquierda tiene grado mayor
mayor o igual que deg(g). Esto serı́a una contradicción, por lo cual debemos tener r̃ − r = 0,
es decir r = r̃ y g(q − q̃) = 0, de donde sigue q − q̃ = 0 y por tanto q = q̃.
                                                 54
   Nos gustarı́a introducir el concepto de máximo común divisor, pero en los polinomios no
tenemos un orden como en Z, y por lo tanto el concepto de “máximo” no es inmediato. Para
poder introducir la idea de máximo común divisor, necesitamos una definición previa adicional.
Diremos que un polinomio p ∈ K[x] es mónico si el coeficiente del término lı́der es 1.
   Dados dos polinomios f, g ∈ K[x], no ambos nulos, su máximo común divisor, que
denotaremos mediante mcd(f, g), es el polinomio mónico de mayor grado que divide tanto a f
como a g. Mostraremos ahora un resultado similar a la identidad de Bezout que hemos probado
sobre el máximo común divisor en Z.
pf + qg,
con p, q ∈ K[x].
   Hasta ahora hemos visto que hay mucha similitud entre los números enteros Z y los poli-
nomios K[x]. Un concepto crucial en Z fue el de los números primos, los cuales eran “ir-
reducibles” en el sentido de que no es posible expresarlos como productos de números más
pequeños. En K[x] podemos introducir una idea similar. Decimos que un polinomio p ∈ K[x]
                                                55
es irreducible si es imposible factorizarlo en K[x]. Es decir, no existen polinomios en K[x]
cuyo producto sea p.
    Lo novedoso aquı́, en relación a Z es que la irreducibilidad de un polinomio depende del
conjunto K en el cual tomamos los coeficientes. Por ejemplo, el polinomio x2 + 1 puede verse
tanto en R[x] como en C[x]. En el segundo caso, este polinomio no es irreducible, pues tenemos
su factorización
                          (x + i)(x − i) = x2 + xi − ix − i2 = x2 + 1.
Veremos más adelante que este mismo polinomio es irreducible visto en R[x].
   Con el concepto de polinomios irreducibles tenemos un resultado análogo al Lema de Gauss
para números enteros. Concretamente, tenemos el siguiente resultado.
Teorema 3.1.4. Sea p ∈ K[x] es irreducible, y f, g ∈ K[x] tales que p divide al producto f g.
Entonces p devide al menos uno de los factores f o g.
Prueba. Dado que p divide al producto f g, tenemos f g = pq, para algún q ∈ K[x]. Supongamos
que p no divide a f . Entonces, dado que p es irreducible en K[x], tenemos
mcd(p, f ) = 1 = αp + βf
Es decir, p divide a g.
Ejercicio 3.1.5 (Algoritmo de Euclides para polinomios). Dados f, g ∈ K[x], no ambos nulos,
muestre que si f = gq + r, en el algoritmo de la división, entonces mcd(f, g) = mcd(g, r).
Explique cómo usar esto para calcular el mcd de dos polinomios.
Teorema 3.1.6 (Factorización única de polinomios). Todo polinomio p ∈ K[x], de grado mayor
o igual que 1, se puede factorizar como una constante a ∈ K por el producto de polinomios
mónicos irreducibles. Dicha factorización es única a menos de reordenamiento de factores.
p = pn xn + pn−1 xn−1 + · · · + p1 x + p0 ,
                                                56
donde el polinomio entre paréntesis es mónico e irreducible.
     Caso contrario, tendremos p = f g, para ciertos polinomios f, g ∈ K[x] de grado menor que p.
Si éstos polinomios son irreducibles, factorizamos el coeficiente de su término lı́der y tendremos
p como una constante por polinomios mónicos irreducibles. Caso contrario, tendremos f o g, o
ambos, como producto de factores de menor grado. Procediento de esta forma, obtendremos p
como producto de una constante por producto de polinomios mónicos de grado cada vez menor.
Estos factores eventualmente serán irreducibles, pues el grado de cada uno va disminuyendo y
todo polinomio de grado 1 es irreducible.
     Supongamos ahora que
                                  af (1) · · · f (r) = p = bg (1) · · · f (s)
Dado que f (1) es irreducible y divide al producto g (1) · · · g (s) , entonces dividirá a alguno de los
factores g (i) . Reordenando si es necesario, podemos asumir que f (1) divide a g (1) , y como ambos
son irreducibles, deben ser iguales. Ası́ tenemos
Ejemplo 3.1.7. Con el teorema de factorización única vemos que x2 + 1 es irreducible en R[x],
pues tenemos x2 +1 ∈ R[x] ⊂ C[x]. Ası́, cualquier factorización de x2 +1 en R[x] serı́a también
una factorización en C[x], pero hemos visto explı́citamente que en C[x] la factorización es
x2 + 1 = (x + i)(x − i),
p = pn xn + pn−1 xn−1 + · · · + pi x + p0 ,
                                                       57
Observación 29. Notemos que para determinar el valor numérico de p en a simplemente
“substituimos” la indeterminada x por el valor a, y efectuamos las operaciones. Esto induce a
pensar que el polinomio p es una función cuya variable es x. Enfatizemos aquı́ que un polinomio
p NO ES UNA FUNCIÓN. Un polinomio p en x es simplemente una expresión que tiene la
forma indicada en (3.1), y que dados dos de ellos sabemos cómo sumarlos y cómo multiplicarlos,
lo cual nos permite hablar de factores, múltiplos, cocientes y restos, de la misma forma como
tenemos dichos conceptos para números enteros. Todo esto lo podemos hacer sin preocuparnos
por cuál es el conjunto al cual pertenece la indeterminada x. Dicho esto, veremos en breve las
“funciones polinomiales”, para las cuales sı́ será importante identificar a qué conjunto pertenece
su variable x.
    El primer resultado interesante que podemos observar sobre las raı́ces complejas de un
polinomio es que dado un polinomio p ∈ R[x] ⊂ C[x] ocurren siempre en pares conjugados.
Enunciemos este resultado como un Teorema, para futuras referencias.
Teorema 3.1.8 (Teorema de las raı́ces complejas). Dado p ∈ R[x] ⊂ C[x]. Si z ∈ C es una
raı́z de p entonces z también es raı́z de p.
p = p n xn + · · · + p 1 x + p 0 ,
0 = pn z n + · · · + p1 z + p0
0 = pn z n + · · · + p1 z + p0 = pz n + · · · + p1 z + p0 = pn z n + · · · + p1 z + p0 .
Teorema 3.1.9 (Teorema del resto). El esto de dividir un polinomio p ∈ K[x] entre el binomio
x − a ∈ K[x] es igual al valor numérico de p en a.
p = (x − a)q + r.
   El siguiente resultado, que establece la relación fundamental que existe entre los conceptos
de raı́z y factor de un polinomio, es una consecuencia inmediata del teorema precedente.
                                                      58
Corolario 3.1.10 (Teorema del factor). Un elemento a ∈ K es raı́z de p ∈ K[x] si, y sólo si,
el binomio (x − a) ∈ K[x] es un factor de p.
Prueba. En efecto, del teorema precedente p = (x − a)q + p(a), y por lo tanto 0 = p(a) si y
solamente si (x − a) es factor de p.
   El siguiente resultado es un criterio útil para determinar raı́ces de polinomios con coeficientes
enteros.
p = pn xn + pn−1 xn−1 + · · · + p1 x + p0 ,
                                                                    a
tal que los coeficientes son enteros y p0 , pn son no nulos. Si     b
                                                                        ∈ Q es raı́z de p con a y b primos
relativos, entonces a es factor de p0 y b es factor de pn
             a
Prueba. Si   b
                 ∈ Q es raı́z de p, entonces
es decir, a es factor de p0 bn . Dado que a y b son primos relativos, obtenemos que a es factor
de p0 . Por otro lado, si en (3.4) factorizamos b y reordenamos, obtenemos
p = (x − a)q (1) ,
para algún q (1) ∈ K[x], con deg(q (1) ) = deg(p) − 1. Si a es también raı́z de q (1) , entonces
tendremos
                             p = (x − a)(x − a)q (2) = (x − a)2 q (2) ,
                                                      59
para algún q (2) ∈ K[x], con deg(q (2) ) = deg(p) − 2. Prosiguiendo, si a es raı́z de q (2) , tendremos
con deg(q (3) ) = deg(p) − 3. Dado que el grado de los cocientes q (i) van disminuyendo en 1 cada
vez que a sea una raiz de estos cocientes, vemos que habrá un paso m tal que a es raı́z de q (m−1)
pero ya no será raı́z de q (m) , y entonces tendremos
p = (x − a)m q (m) ,
donde deg(q (m) ) = deg(p) − m y a no es raı́z de q (m) . En este caso, decimos que m es la
multiplicidad de a como raı́z de p.
Observación 30. Vemos de paso que un polinomio p ∈ K[x], de grado n, puede tener como
máximo n raı́ces contando multiplicidades.
    El siguiente resultado, conocido como Teorema Fundamental del Álgebra, establece que todo
polinomio p ∈ C[x], de grado n ≥ 1, tiene exactamente n raı́ces en C, contando multiplicidades.
La primera prueba de este teorema se debe a Argand, y data de 1806. Posteriormente, Gauss
ofreció varias pruebas más, y actualmente se conocen más de una decena de pruebas de este
resultado, pero ninguna de ellas está al alcance de los conceptos desarrollados en estas notas,
pues todas ellas usan en mayor o menor medida conceptos de análisis y/o topologı́a.
Teorema 3.1.12 (Teorema Fundamental del Álgebra). Dado p ∈ C[x], de grado n ≥ 1, existen
c, z1 , z2 , . . . , zr ∈ C y k1 , k2 , . . . , kr ∈ N tales que
                                                    60
Observación 32. Notemos que en este caso f (x) = an xn + an−1 xn−1 + · · · + a1 x + a0 ∈ R,
aunque no sepamos a priori el valor de este número real, hasta que escojamos un valor para
x. Esto contrasta con el polinomio an xn + an−1 xn−1 + · · · + a1 x + a0 ∈ R[x], que si bien tiene
coeficientes en R, el polinomio no es un elemento de R. Sólo al substituir la indeterminada por
un valor a ∈ R, obtenemos el “valor numérico” del polinomio, que sı́ es un elemento de R.
   A las funciones polinomiales se les varias de las terminologı́as que vimos para polinomios.
Por ejemplo, al término a0 se lo denomina el término independiente o constante, al término
de mayor potencia en x se lo denomina término lı́der o principal, y al valor del exponente
máximo se lo denomina el grado de la función polinomial. Algunos casos especiales merecen
atención: cuando sólo aparece el término constante, es decir f (x) = a0 , decimos que f es una
función constante. Sı́ el grado es 1, esto es, f (x) = a1 x+a0 , decimos que f es lineal. Cuando el
grado es 2, nos referimos a f como una función cuadrática, y cuando el grado es 3 la llamamos
una función cúbica. A partir de grado n = 4, y superiores, usualmente nos referimos a f como
función polinomial de grado n
se le puede aplicar el Teorema del factor, válido para expresiones polinomiales, y concluir que
a ∈ R es cero de f si y sólo si la función lineal x − a es un factor de f , es decir, podemos escribir
f (x) = (x − a)g(x),
donde g será otra función polinomial de grado menor que f , concretamente deg(g) = deg(f )−1.
En caso de que a sea una raı́z de multiplicidad r para la función f , tedremos
                                                   61
                     Figure 3.1: Gráfica de algunas funciones polinomiales
polinomial, y por lo tanto las correpondientes expresiones lineales son factores de la función
original. Además, podemos concluir que una función f : R → R polinomial de grado n puede
anularse como máximo en n puntos diferentes.
                                                     g(x)
                                           f (x) =        ,
                                                     h(x)
                                                62
                            Figure 3.2: Gráfica del Ejemplo 3.3.1
                                                  g̃(x)
                                   f (x) =                    ,
                                             (x − a)n−m h̃(x)
y por lo tanto de nuevo tendremos que |f (x)| crece indefinidamente a medida que x se aproxima
al valor a.
    Si m ≥ n, tendremos que f (x) se hace arbitrariamente pequeño a medida qeue x se aproxima
al valor a, pues siempre que x ̸= a, podremos escribir
                                                         g̃(x)
                                   f (x) = (x − a)m−n          .
                                                         h̃(x)
                                                  x3 − 2x
                                        f (x) =           .
                                                   x2 − 1
                                       (x2 − 4x + 4)(x2 − 6x + 9)
                             f (x) =                              .
                                             (x − 2)3 (x − 3)
                                                  63
                         Figure 3.3: Gráfica de f (x) del Ejemplo 3.3.2
Ası́, también se anula en los mismos puntos x = 2 y x = 3. Dadas las multiplicidades, vemos
que si x ∈
         / {2, 3} podemos expresar f como
                                                    x−3
                                          f (x) =       .
                                                    x−2
                                                64
hacia +∞ o hacia −∞). Entonces, podemos observar que para valores muy grandes de |x|
tenemos la aproximación
                                      x−3    x
                              f (x) =     ≈ = 1.
                                      x−2    x
Ası́, la gráfica de f se aproxima indefinidamente a la recta y = 1 cuando su argumento se aleja
del origen, en cualquiera de las direcciones. Decimos que esta recta y = 1 es una ası́ntota
horizontal de f .
    Más generalmente, si tenemos una función polinomial f : X → R, de la forma
para valores muy grandes de |x|, tanto en el numerador como en el denominador, predominan
los términos lı́deres, y podemos considerar la aproximación
                                               p(x)  pn
                                     f (x) =        ≈ xm−n .
                                               q(x)  qn
donde ax + b es el cociente de dividir p entre q y r es el resto, que satisface deg(r) < deg(q).
Ası́, obtenemos
                                        p(x)              r(x)
                                f (x) =      = ax + b +        .
                                        q(x)              q(x)
   En esta expresión, vemos que cuando |x| se hace muy grande, el valor |r(x)/q(x)| se hace
arbitrariamente pequeño, pues deg(r) < deg(q). Por lo tanto, tenemos la expresión aproximada
f (x) ≈ ax + b,
p = gq + r,
                                             p(x)          r(x)
                                   f (x) =        = g(x) +      ,
                                             q(x)          q(x)
                                                 65
                            Figure 3.4: Gráfica del Ejemplo 3.3.3
tendremos que |r(x)/q(x)| se hace arbitrariamente pequeno cuando |x| se hace arbitrariamente
grande, y por lo tanto
                                         f (x) ≈ g(x),
para valores muy frandes de |x|. Dado que deg(g) ≥ 2, esta función crece más rápido que
cualquier recta no vertical, y por lo tanto ninguna recta oblı́cua puede ser ası́ntota de f .
                                                           −32
Ejemplo 3.3.3. Consideremos la función racional f (x) = xx−2 . Del algoritmo de la división,
tenemos
                             x2 − 3 = (x + 2)(x − 2) + 1,
de donde
                                         x2 − 3        1
                               f (x) =          =x+2+     .
                                         x−2          x−2
Entonces, la recta y = x + 2 es una ası́ntota oblı́cua. Además, tenemos una ası́ntota vertical
en x = 2, pues es raı́z del denominador, y no lo es del numerador. La gráfica de esta función
racional se ilustra en la Figura 3.4, donde hemos incluido la ası́ntota oblı́cua.
                                              66
                             Figure 3.5: Gráfica del Ejemplo 3.3.4
                                                                                   √
Ejemplo 3.3.4. Consideremos la función f : X → R definida mediante f (x) = x − 2. Vemos
que el radicando es una función polinomial, y por lo tanto f (x) es una función irracional. Para
este ejemplo, vemos que su dominio excluye a todos los valores tales que el radicando es negativo.
Ası́, tenemos X = [2, ∞).
                                                                            x +3 2
Ejemplo 3.3.5. Consideremos la función f : X → R definida por f (x) = √    3
                                                                              x−2
                                                                                  . Esta función
es irracional, por el radical de la función polinomial en el denominador. En este caso, la raı́z
cúbica no genera problemas con el signo del radicando, sin embargo, el denominador se anula
para x = 2, y por lo tanto ese punto no forma parte del dominio de f . Tenemos X = R \{2}.
Puesto que el numerador no se anula en las cercanı́as de x = 2, podemos inferir que |f (x)|
crece indefinidamente a medida que x se aproxima de 2.
                                                       3
Ejemplo 3.3.6. Consideremos la función f (x) =      3 x−2 .
                                                     √         De nuevo en este caso, aparece en el
                                               67
denominador un radical de la función polinomial g(x) = x, y por lo tanto f (x) es irracional.
Esta función está definida para todo valor de x tal que el denominador no se anule, es decir,
               √
para todo x ̸= 3 2.
     En ocasiones puede ser interesante modificar la expresión de una función irracional expresada
como una fracción mediante la racionalización de su denominador. El procedimiento general es
multiplicar tanto el numerador como el denominador por una expresión tal que el denominador
se racionaliza, es decir, desaparecen las expresiones radicales. El factor por el cual se multi-
plican el numerador y el denominador se denomina racionalizante del denominador. Más
allá de esto, no hay métodos generales, es decir, la determinación del racionalizante dependerá
de cada caso analizado. Ilustraremos esto mediante algunos ejemplos.
                                                       x−5
Ejemplo 3.3.7. Consideremos la función f (x) = √x−1−2     . Vemos que en el denominador
                                                                                  √
podemos obtener una diferencia de cuadrados si lo multiplicamos por la expresión x − 1 +
2. Para no alterar la fracción, debemos multiplicar el numerador por la misma expresión, y
tendremos
                             √                     √                      √
     x−5           x−5         x−1+2      (x − 5)( x − 1 + 2)     (x − 5)( x − 1 + 2)
  √          =√              √          =      √               =
    x−1−2         x−1−2 x−1+2                 ( x − 1)2 − 4             (x − 5)        (3.5)
                √
             = x−1+2
                                           √                      x−5
    Hay que notar que la función g(x) = x − 1+2 y f (x) = √x−1−2       no son iguales. La primera
está definida para todo x ≥ 1, en tanto que la segunda no está definida en x = 5. El dominio
de f es [1, ∞) \ 5, en tanto que el dominio de g es [1, ∞). En el último simplificación de la
ecuación (3.5), la simplificación del factor x − 5 no está permitida si x = 5.
                                                68
                                                                                CAPÍTULO        4
En este capı́tulo introduciremos algunas fuciones que son de gran relevancia en el estudio del
cálculo y en sus aplicaciones. Estas funciones se diferencian marcadamente de las funciones
algebraicas (polinomiales, racionales e irracionales) que hemos visto hasta ahora, y reciben
el nombre de funciones trascendentales. De forma más precisa, las funciones algebraicas
se caracterizan por ser soluciones de ecuaciones polinomiales cuyos coeficientes son a su vez
polinomios. Por su parte, las funciones trascendentales no cumplen dicho criterio. Entre
este tipo de funciones encontraremos las trigonométricas, los expoenenciales, logaritmos, y las
trigonométricas hiperbólicas. Describiremos las propiedades más básicas de estas funciones a fin
de obtener familiaridad con los mismos. En los cursos de cálculo se desarrollaran herramientas
más sofisticadas para estudiar estas funciones con más profundidad. Una buena referencia para
complementar este capı́tulo es el texto [10]
                                                69
este ángulo, consideramos una semirecta r que inicialmente coincide con el semieje positivo x y
lo giramos por el valor del ángulo t. Esta semirecta intersecta al cı́rculo de radio 1 en un punto
que denotaremos mediante P (t) = (x(t), y(t)). Definimos las funciones
sin : R → R cos : R → R
mediante sin(t) = y(t) y cos(t) = x(t), dadas por la construcción del punto P (t).
    Directamente de la definición de estas funciones como las coordenadas del punto P (t) ob-
servamos que su imagen, también llamado recorrido o rango es el intervalo [−1, 1]. Ası́,
podemos escribir
                             sin : R → [−1, 1] cos : R → [−1, 1].
    También vemos, analizando el triángulo rectángulo formado por el origen, el punto P (t) y
el punto x(t) que se tiene la relación fundamental
sin2 t + cos2 t = 1.
Observación 34. Del análisis del triángulo mencionado, deberı́amos escribir (sin t)2 +(cos t)2 =
1, pero es una costumbre ampliamente aceptada usar la notación (f (t))2 = f 2 (t), para cualquier
función f .
    También de la construcción del punto P (t) vemos que sin(t) = 0 precisamente cuando P (t)
está sobre el eje x, lo cual ocurre cuendo t = nπ, con n ∈ Z, y cos(t) = 0 precisamente cuando
P (t) está sobre el eje y, lo cual ocurre cuando t = (2n + 1)π/2 con n ∈ Z.
    Tambien, analizando los signos de las coordenades de P (t) podemos deducir el signo de las
funciones sin y cos para valores de t en los diferentes cuadrantes.
    Vemos también que P (t) = P (t + 2nπ), cualquiera sea n ∈ Z. Sigue de eso que, para todo
n∈Z
    Dada una función f : R → R, decimos que es periódica si existe un número positivo T > 0
tal que f (t + T ) = f (t), para todo t ∈ R. El menor T tal que se cumple esta propiedad se
denomina el periodo de f .
    De la observación previa, vemos que las funciones sin : R → [−1, 1] y cos : R → [−1, 1] son
ambas periódicas con periodo 2π.
    También podemos observar la siguiente propiedad: dado t y −t, vemos que P (t) y P (−t)
son simétricos respecto del eje x. Por lo tanto, concluimos que
                                        sin(−t) = − sin t,
                                                                                              (4.2)
                                        cos(−t) = cos t.
                                                 70
                              Figure 4.1: Gráfica de la función seno.
    Cuando una función f : R → R cumple f (−t) = f (t), decimos que es par, y cuando cumple
f (−t) = −f (t) decimos que es impar. Lo que hemos observado es que sin : R → [−1, 1] es
impar, en tanto que cos : R → [−1, 1] es par.
    Con estas propiedades podemos esbozar el gráfico de las funciones sin : R → [−1, 1] y de
cos[−1, 1]. Si queremos realizar un bosquejo a mano, deberı́amos obtener P (t) = (cos t, sin t)
para varios valores de t en el intervalo [0, 2π], para poder tener suficientes puntos del gráfico.
    En la Figura 4.1 se ilustra el gráfico de la función seno, y se indican sus raı́ces y sus extremos
a lo largo de un periodo. En la Figura 4.2 tenemos lo mismo para la función coseno, y en la
Figura 4.3 tenemos las gráficas superpuestas de las dos funciones. En todas estas figuras, en el
eje x se indica el argumento en radianes.
                                                  71
   De estos gráficos es aparente la relación de desplazamiento que existe entre estas dos fun-
ciones, concretamente, tenemos las relaciones
    Estas relaciones también pueden inferirse de la construcción del punto P (t) = (cos t, sin t),
pues, si al argumento t le restamos π/2, equivale a mover el punto P sobre el cı́rculo unitario un
arco de π/2 radianes en sentido horario, y por lo tanto el segmento OP (t) debe ser perpendicular
al segmento OP (t−π/2). Esto transforma las coordenadas de P (t) = (cos t, sin t) a P (t−π/2) =
(cos(t − π/2), sin(t − π/2)) = (sin t, − cos t)
    A partir de las funciones sin : R → R y cos : R → R podemos definir las otras 4 funciones
trigonométricas usuales, a saber
                                            sin t
                    tan : X → R; tan t :=          , t∈
                                                      / {(2n + 1)π/2; n ∈ Z},
                                            cos t
                                              1
                     sec : X → R; sec t :=        , t∈/ {(2n + 1)π/2; n ∈ Z},
                                            cos t                                              (4.5)
                                             1
                     csc : X → R; csc t =        ; t∈/ {nπ; n ∈ Z},
                                           sin t
                                            cos t
                     cot : X → R : cot t =         ; t∈
                                                      / {nπ; n ∈ Z}.
                                             sin t
     Las propiedades fundamentales de todas estas funciones pueden obtenerse a partir de las
propiedades de las funciones seno y coseno. Por ejemplo, dado que para valores de t cercanos
a las raı́ces de cos t la función seno no se anula, vemos que la función tangente tiene ası́ntotas
verticales en dichos puntos. En la Figura 4.4 vemos el gráfico de la función tangente, con las
ası́ntotas verticales en ±π/2.
     De las relaciones sin(t + π) = − sin t y cos(t + π) = − cos t obervamos que
por tanto, la función tangente es periódica con periodo p ≤ π. Por otro lado, vemos que
tan(0) = 0, y dado que el seno no se anula para valores 0 < t < π, concluimos que p no puede
ser menor que π. Entonces debemos tener que el periodo de la función tangente es p = π.
                                                72
                          Figure 4.4: Gráficas de la función tangente.
Ejercicio 4.1.2. Determine el rango y el periodo para las demás funciones listadas en la
Ecuación 4.5.
f : X → f (X)
y = arcsin(x) ⇔ x = sin y.
                                                73
                          Figure 4.5: Gráfica de la función arco seno.
y cos(X) = [−1, 1], entonces sobre este intervalo podemos definir la función inversa del coseno,
al cual llamaremos arco coseno, como
y = arccos x ⇔ x = cos y.
                                                74
                        Figure 4.7: Gráfica de la función arco tangente.
intervalo es toda la recta. Ası́, podemos definir la función arco tangente, como
y = arctan x ⇔ x = tan y.
En la Figura 4.7, vemos la gráfica de esta función, junto con sus ası́ntotas horizontales y = ±π/2.
Observación 35. Las funciones arco seno, arco coseno y arco tangente aparecen con mucha
más frecuencia en las aplicaciones que las funciones arco secante, arco cosecante y arco cotan-
gente, las cuales serı́an definidas sobre intervalos donde las funciones secante, cosecante y
cotangente son inyectivas. Generalmente las calculadores cientı́ficas tienen teclas especı́ficas
para el cálculo de las funciones arco seno, arco coseno y arco tangente, pero no para las demás
funciones trigonométricas inversas. De cualquier manera, si se hace necesario calcular dichas
funciones inversas, pueden usarse identidades trigonométricas apropiadas. Por ejemplo, la
función arco secante quedarı́a definida por la relación
y = arcsec x ⇔ x = sec y.
Ası́, podemos concluir que arcsec x = arccos(1/x) calcular el arco secante usando la función
arco coseno.
                                                 75
4.2      Funciones exponenciales y logarı́tmicas
En esta sección retomaremos los conceptos de exponencial y logaritmo, pero daremos énfasis
al punto de vista de funciones. La definición rigurosa de estas funciones requiere de las her-
ramientas del cálculo que aún no tenemos disponible. Sin embargo, una vez definida una de
ellas, la otra se puede definir como su inversa, y es conveniente comenzar a familiarizarse con
estas funciones, y entender su interrelación y propiedades básicas aunque sea apoyándonos en
ideas intuitivas, en espera de tener las herramientas de cálculo apropiadas para un desarrollo
más formal y riguroso.
    Iniciaremos con las funciones exponenciales, tomando como punto de partida que entende-
mos intuitivamente lo que significa elevar un número a una determinada potencia. Entonces,
dado un número real positivo a, definimos la función exponencial de base a
    Observamos que, sin importar la base a, tendremos expa (0) = a0 = 1. Vemos también que
si a = 1, entonces exp1 (x) = ax = 1, y tenemos simplemente la función constante igual a 1.
Por otro lado, si a > 1, entonces dados x1 < x2 tendremos
expa : R → R+
Del hecho que esta función sea creciente (a > 1) o decreciente (0 < a < 1) se concluye que esta
función es inyectiva.
   Estas propiedades se ilustran con los gráficos de expa : R → R tanto para 0 < a < 1 como
                                                76
                        Figure 4.8: Gráficas de exp2 (x) y de exp1/2 (x)
para a > 1, en la Figura 4.8, concretamente exp2 (x) (azúl) y exp1/2 (x) (rojo).
   De entre todas las bases que podemos elegir para la función exponencial expa , la más
importante es la que corresponde al número e. En ese caso, simplemente se omite indicar la
base, y usamos la notación
                                  exp : R → R+ ; exp(x) = ex .
    En la Figura 4.9 podemos observar la gráfica de esta función. La función exp(x) = ex es tan
importante, que por lo general cuando se usa la expresión función exponencial, por defecto se
asume que se refiere a esta función, y no a cualquier otra función exponencial con alguna base
a ̸= e.
    Consideremos ahora las funciones logarı́tmicas. Para ello, recordemos primeramente lo que
significa el logaritmo de un número. En la Ecuación (2.3) hemos definido el logaritmo en base
a de un número b mediante la relación
loga (b) = r ⇔ ar = b,
válida para cualquier real r y a > 0. Allı́ hemos observado también que dada estas condiciones,
el número b será siempre positivo.
     Podemos observar entonces que, dada una base a positiva diferente de 1, podemos pensar
en el logaritmode base a como una función
loga : R+ → R
                                               77
                         Figure 4.10: Gráficas de log2 (x) y de log1/2 (x)
    Dado que para cada valor fijado de a obtendremos funciones diferentes, a saber loga y logb ,
hablamos de funciones logarı́tmicas. Cada una de ellas es la inversa de la correspondiente
función exponencial expa : R → R+ .
    Siendo loga : R+ → R la inversa de expa : R → R+ podemos deducir fácilmente sus
propiedades más elementales. Por ejemplo, cualquiera sea la base a ̸= 1, la función loga : R+ →
R es una biyección, y loga (0) = 1. Por otro lado, la función loga : R+ → R es creciente si a > 1
y decreciente si 0 < a < 1. Las gráficas de estas funciones para a = 2 (rojo) y a = 1/2 (verde)
se ilustran en la Figura 4.10.
    El caso a = e nuevamente adquiere relevancia, y se acostumbra usar la notación
loge = ln : R+ → R .
En la siguiente sección usaremos esta propiedad junto con la identidad de Euler para dar sentido
a la función exponencial de argumento complejo.
                                                78
4.3        Exponencial compleja y Trigonométricas hiperbólicas
Podemos usar las funciones exp = expe y las funciones cos y sin, definidas para variable real,
para definir la función exponencial de variable compleja.
   Concretamente, dado z = x + iy ∈ C, definimos la función
exp : C → C,
mediante
                        exp(z) = exp(x + iy) := exp(x)[cos y + i sin y],
donde, del lado derecho las funciones exp, cos y sin son las funciones de variable real que hemos
considerado antes.
    En la Observación 26 mencionamos la identidad eiφ = cos φ + i sin φ. En esa ocación
usamos eiφ apenas como un sı́mbolo para denotar el número complejo cos φ + i sin φ. Con la
definición de exponencial complejo que hemos introducido ahora, tenemos de hecho que, para
z = iφ = 0 + iφ:
Ası́, lo que en su momento interpretamos apenas como una notación, puede interpretarse ahora
de hecho como el número complejo que se obtiene como imagen de iφ bajo la función exp C → C.
    Observemos que la función exp : C → C tiene la importante propiedad de periodicidad. De
hecho, vemos que, si z = x + iy, entonces:
y
                         exp(z) = exp(x + iy) = exp(x)[cos y + i sin y],
implican
                           cos(y + α) + i sin(y + α) = cos y + i sin y.
Donde, igualando partes reales entre sı́ y partes imaginarias entre sı́, concluimos que α = 2nπ,
                                               79
con n ∈ Z.
   Note que esta propiedad contraste con el caso de la exponencial real, la cual no tiene
periodicidad, sino que es monótona creciente o monótona decreciente.
Observación 36. Conviene observar que la definición totalmente rigurosa de estas funciones
requiere de herramientas de cálculo. Más adelante, en cursos de cálculo el estudiante podrá
ver que una forma de definir estas funciones es mediante el uso de series y el concepto de
convergencia.
                                                     eiz + e−iz
                              sin : C → C; sin(z) :=
                                                         2i                               (4.8)
                                                     eiz + e−iz
                              cos : C → C; cos(z) :=            .
                                                          2
A su vez, a patir de las funciones sin y cos, de variable compleja, podemos definir la función
tan : X ⊂ C → C mediante
                                                   sin z
                                           tan z =       ,
                                                   cos z
para cualquier valor z tal que cos z ̸= 0.
   Las funciones secante, cosecante y cotangente pueden definirse para variables complejas
mediante las relaciones dadas en la Ecuación (4.5).
Ejercicio 4.3.1. Muestre que las funciones trigonométricas complejas satisfacen las siguientes
propiedades
a) sin2 z + cos2 z = 1
b) sin(−z) = − sin z
c) cos(−z) = cos z
                                               80
                             Figure 4.12: Gráfica de sinh : R → R
    Finalmente, mediante las funciones trigonométricas complejas podemos definir las funciones
trigonométricas hiperbólicas. Concretamente, definimos el seno hiperbólico sinh : R → R
mediante la expresión
                                                        ex − e−x
                                 sinh x := −i sin(ix) =
                                                            2
y el coseno hiperbólico cosh : R → R mediante la expresión
                                                 e−x + ex   ex + e−x
                           cosh x := cos(ix) =            =          .
                                                    2           2
    Las gráficas de estas funciones se pueden observar, respectivamente, en las Figuras 4.12 y
4.13
    Observamos que sinh x crece indefinidamente cuando x > 0 crece indefinidamente (ex crece
y e−x = 1/ex decrece). Por otro lado, sinh x decrece indefinidamente cuando x < 0 y |x| crece
indefinidamente. Ası́, el rango de sinh es R. Por su parte, vemos que cosh x es siempre mayor
o igual que 1, y crece indefinidamente cuando |x| se crece indefinidamente. Ası́, su rango es el
intervalo [1, ∞).
                                                 81
                             Figure 4.14: Gráfica de tanh : R → R
                                                     sinh x
                                        tanh x :=           .
                                                     cosh x
Notemos que la función cosh nunca se anula, pues en su definición vemos que su numerador
nunca se anula (suma de dos reales positivos). Por eso, la función tangente hiperbólica queda
definida sobre todo R. Su gráfica puede observarse en la Figura 4.14, donde hemos indicado
también sus dos ası́ntotas horizontales, en y = ±1. La determinación rigurosa de estas ası́ntotas
requiere el concepto de lı́mite de funciones, que sera desarrollada en los cursos de cálculo.
a) cosh 2 − sinh2 = 1
b) sinh(−x) = − sinh(x)
c) cosh(−x) = cosh(x)
                                                82
Ejercicio 4.3.3. Determine el dominio y rango de las funciones secante hipebólico, cosecante
hiperbólico y cotangente hiperbólico.
                                                83
                                                                                 CAPÍTULO         5
Combinatoria Básica
En este capı́tulo estudiaremos formas indirectas de contar elementos de conjuntos finitos. Ver-
emos que incluso con conjuntos con relativamente pocos elementos, pueden surgir situaciones
de conteo de configuraciones de sus elementos que serı́an imposible de contar de forma directa.
La combinatoria busca determinar estas cantidades mediante un razonamiento que aprovecha
ciertos patrones. Considere por ejemplo la siguiente situación: diez personas deben sentarse es
un salón ocupando cada una una silla enumerada, y cada dı́a desean hacerlo en una configuración
diferente (esto es, que no ocurra que las mismas personas ocupen las mismas sillas). Esto nos
plantea al menos dos preguntas. La primera es si eventualmente nos veremos obligados a repetir
una configuración que ya ha sido utilizada, y la segunda es, cuántas configuraciones tenemos
disponible.
    Es relativamente evidente que la respuesta a la primera es que sı́, más tarde o más tem-
prano tendremos que repetir configuraciones, porque las diferentes configuraciones que puedan
formarse conforman un conjunto finito, y si tenemos tiempo disponible, las habremos ocupado
todas y tendremos que repetir. La segunda es una pregunta más complicada, pero de hecho,
la respuesta es 3628800. Esto ilustra que un intento de enumerar todas las configuraciones
posibles, para realizar un conteo directo podrı́a ser impracticable. La respuesta a la segunda
pregunta también arroja una nueva luz sobre la primera. Pues, si bien es finita la cantidad
de configuraciones, lo cual nos llevó a concluir que más tarde o más temprano tendremos que
repetir configuraciones, la cantidad total disponible es tan grande que si usáramos una configu-
ración por dı́a, no tendrı́amos que repetir ninguna en más de 9000 años. Esto indica que en
la práctica, si estamos tratando realmente con 10 personas que deben sentarse en configura-
ciones diferentes, no serı́a fı́sicamente obligatorio repetir configuraciones. Para complementar
con ejercicios el material teórico de esta sección, el lector puede consultar las referencias [7, 3]
                                                 84
5.1      Principios fundamentales de conteo
Varios de los resultados que estudiaremos en este capı́tulo se referirán a la cantidad de elementos
de conjuntos finitos. Recordemos que un conjunto X es finito si es vacı́o o si podemos listar
(aunque sea en principio) todos sus elementos. Para poder enunciar con más precisión los
resultados, reformularemos ahora la noción de conjunto finito haciendo uso de la noción de
función biyectiva y del conjunto numérico N.
   Dado un número natural, n ∈ N, pongamos
Jn = {1, 2, . . . , n}.
f : X → Jn .
Cuando dicha biyección existe, diremos que es una enumeración de los elementos de X, y al
número n lo llamaremos la cardinalidad de X, y lo denotaremos mediante |X|. Cuando X = ∅,
estableceremos que su cardinalidad es 0. En la mayorı́a de los casos estaremos interesados en
conjuntos finitos no vacı́os.
    Ahora estamos en condiciones de enunciar de forma precisa varios principios de conteo.
Quizás el más básico de todos es el llamado Principio del palomar, también conocido como
Pricipio de Dirichlet, que establece lo siguiente.
Teorema 5.1.1 (Principio del Palomar). Si X e Y son conjuntos finitos y |X| > |Y |, no
puede existir una función inyectiva f : X → Y .
    Aceptaremos este resultado sobre la base de la intuición. Pues, si enumeramos los elementos
de X e Y podrı́amos escribir X = {x1 , x2 , . . . , xm } e Y = {y1 , y2 , . . . , yn }. Dado que m > n,
cualquier función de X a Y tendrá que asignar más de un elemento de X al mismo elemento
de Y , con lo cual deja de ser inyectiva. Esta interpretación intuitiva le vale el nombre del
Principio del Palomar, pues se puede pensar que los xi son palomas, y los yi son casillas de
un palomar. La función f : X → Y serı́a colocar una paloma en una casilla, y dado que hay
más palomas que casillas, necesariamente tendremos que colocar más de una paloma en alguna
de las casillas disponibles.
    El siguiente principio de conteo establece la cardinalidad de una unión disjunta de conjuntos
finitos, y suele denominarse principio de la suma.
El principio de la suma suele usarse en conjunto con otro principio, conocido como el
                                                    85
principio de multiplicación, el cual establece la cardinalidad de un producto cartesiano
de conjuntos finitos no vacı́os.
   Esto es, la cardinalidad del producto cartesiano de conjuntos finitos (no vacı́os) es el pro-
ducto de las cardinalidades de los conjuntos factores. Este resultado puede probarse usando el
principio de inducción, pero no lo haremos aquı́.
   En ocasiones este principio se enuncia en términos de las formas en que pueden ocurrir
sucesos independientes, de la siguiente manera: Si r sucesos etiquetados si pueden ocurrir
cada una de ni formas diferentes, entonces la forma total en que pueden ocurrir los r sucesos
(asumiendo que son independientes) es
n1 · n2 · · · nr .
El problema con este enunciado es que introduce mucha terminologı́a que no esta bien definida
(que tipos de sucesos? Qué significa independientes?). El principio matemático del conteo que
nos interesa es el enunciado en el Teorema 5.1.3, y lo que podemos hacer ahora es interpretar
los problemas en términos de conjuntos para poder aplicarles el resultado del Teorema. Veamos
con un ejemplo.
Ejemplo 5.1.4. Supongamos que queremos ir de una ciudad A a otra D, pasando por dos
ciudades intermediaras, digamos B y C. Si existen 3 caminos de A hastsa B, 4 caminos de
B hasta C, y 5 caminos de C hasta D, Cuantos caminos diferentes tenemos para escoger en
nuestro paseo de A hasta D. Aquı́, lo que tenemos son 3 conjuntos, a saber
Tenemos además |CAB | = 3, |CBC | = 4 y |CCD | = 5. Para ir desde A hasta D pasando por B
y D debemos elegir sucesivamente un elemento de CAB , luego otro de CBC y otro de CCD , lo
que nos da un elemento
                              (c1 , c2 , c3 ) ∈ CAB × CBC × CCD .
                                                   86
Observación 38. En el ejemplo precedente, los “sucesos” corresponderı́an al hecho de moverse
de una ciudad a otra, en la secuencia A → B → C → D. Ası́, el primer suceso serı́a ir de A a
B, lo cual puede ocurrir de 3 formas diferntes. El segundo suceso serı́a ir de B hasta C, lo cual
puede ocurrir de 4 formas diferentes, y el tercer suceso serı́a ir de C hasta D, lo cual puede
ocurrir de 5 formas diferentes. La “independencia” de los sucesos se refiere a que la ocurrencia
de uno de los sucesos (en cualquiera de sus formas) no afecta las formas en que pueden ocurrir
los demás sucesos.
   Veamos un ejemplo en que se usan los principios de la suma y de la multiplicación juntos.
Ejemplo 5.1.5. Supongamos que para un paseo desde una ciudad A hasta una ciudad D,
tenemos la opción de pasar o bien por una ciudad intermediaria B o bien por otra ciudad
intermediara C. Si hay 3 caminos para ir de A hasta B y 2 para ir de B hasta D, mientras
que hay 4 caminos para ir de A hasta C y 3 caminos para ir de C hasta D, de cuantas formas
posibles podrı́amos realizar el paseo?
    En este caso, tenemos dos alternativas disjuntas, a saber: pasar por B o pasar por D.
Entonces la cardinalidad de la unión de estas alternativas deberán ser sumadas, de acuerdo
con el principio de la suma. Por su parte, para cada alternativa intermediaria A → B → D o
A → C → D, tenemos que aplicar el principio de multiplicación, para determinar la cantidad
total de caminos disponibles en cada secuencia. Para la secuencia A → B → D tenemos
3 · 2 = 6 opciones y para la secuencia A → C → D tenemos 4 · 3 = 12 opciones. El total se
obtiene de sumar estas cantidades, es decir 6 + 12 = 18 opciones.
    El siguiente principio de conteo, conocido como Principio de inclusión-exclusión es-
tablece la cardinalidad de una unión de conjuntos finitos cuando no necesariamente son disjun-
tos. Lo veremos sólo para el caso de 2 conjuntos, debido a que el caso general involucra una
fórmula mucho más complicada.
Teorema 5.1.6 (Principio de inclusión-exclusión). Consideremos dos conjuntos finitos no
vacı́os X1 y X2 . Entonces tenemos
                                               87
5.2     Arreglos
Consideremos un conjunto X tal que |X| = n. Un arreglo es cualquier agrupamiento realizado
sobre los elementos de X. Por ejemplo, consideremos el conjunto
X = {a, b, 2, 5, ∗}.
Entonces tenemos que ab, ba5, y b25∗ son todos arreglos formados a partir de los elementos de
X. La cantidad de elementos considerados en cada arreglo es el tamaño del arreglo. Veremos
que en muchas situaciones nos interesará fijar un tamaño para los arreglos. En los ejemplos
ilustrados previamente, todos los arreglos son de tamaño distinto, y como tal son arreglos
diferentes. Por otro lado, si consideramos el arreglo ba, vemos que tiene el mismo tamaño que
ab y está formada usando los mismos elementos, pero el ordenamiento es diferente. Veremos
que hay situaciones en que querremos distinguir entre los dos. Ası́, fijado un tamaño para los
arreglos, tenemos dos alternativas interesantes, a saber: considerar o no el ordenamiento de los
elementos.
arreglos diferentes de tamaño |X| sobre el conjunto X. Este tipo de arreglo es tan importante
que recibe el nombre especial de permutación, y si n = |X| al número de permutaciones sobre
el conjunto X se lo denota mediante
Pn = n · (n − 1) · · · 3 · 2 · 1.
0! := 1; n! := n(n − 1) · · · 3 · 2 · 1, si n ≥ 1.
                                                 88
Ası́, dado un conjunto X con |X| = n, la cantidad de permutaciones sobre X es
Pn = n!.
   El siguiente caso interesante es cuando, dado un conjunto X con |X| = n, fijamos un tamaño
0 < m < n para los arreglos y discriminamos por su ordenamiento. Un análisis similar al caso
en que m = n nos conduce a que la cantidad total de arreglos de tamaño m sobre X es
n · (n − 1) · (n − 2) · (n − (m − 1)),
nV m = Vmn .
Observemos que dado un conjunto X con |X| = n, las permutaciones sobre X son un caso
particular de las variaciones de tamaño m sobre X, en el cual tenemos m = n = |X|.
   Además, observemos la siguiente igualdad
                                                   n · (n − 1) · (n − 2) · · · 3 · 2 · 1      n!
    n · (n − 1) · (n − 2) · · · (n − (m − 1)) =                                          =          .
                                                  (n − m) · (n − m − 1) · · · 3 · 2 · 1    (n − m)!
Ası́, dado un conjunto X podemos ver que las variaciones de m en n = |X| y las permutaciones
sobre X se relacionan mediante
                                               Pn
                                      Vmn =           .
                                            (n − m)!
   Finalmente, consideremos un conjunto X tal que |X| = n, y fijemos un tamaño 0 < m <
n para los arreglos, pero esta vez no distinguiremos entre arreglos que sólo difieran por el
ordenamiento de los elementos que los conforman. Este tipo de arreglos recibe el nombre de
combinación de n en m, y la cantidad total de tales arreglos se denota mediante
                                                   
                                             n     n
                                    nCm = Cm =         ,
                                                   m
                                     Vmn
                                
                         n      n              Pn           n!
                        Cm   =     =     =            =            .
                                m    m!    (n − m)!m!   m!(n − m)!
                                                   89
5.2.2     Arreglos con repeticiones
Dado un conjunto finito no vacı́o, A, una variación con repetición de tamaño r sobre A es
un elemento de Ar := A × A × · · · × A, que es el producto cartesiano de A consigo mismo r − 1
veces. Otra forma de verlo, es que una variación de tamaño r sobre A es una lista ordenada
de r elementos de A, pudiendo repetir elementos. Por ejemplo, si A = {a, b, c, 4, 5}, entonces
algunas variaciones de tamaño 3 sobre A podrı́an ser
V Rrn = nr . (5.1)
     Consideremos ahora la siguiente situación. Digamos que tenemos 3 pelotas de color azúl, 4
pelotas de color blanco y 5 pelotas de color celeste. De cuantas formas diferentes podrı́amos
colocarlas en una fila, considerando que el intercambio entre dos pelotas del mismo color no
genera una nueva configuración? Podemos razonar de la siguiente forma: Coloquemos las
3 + 4 + 5 = 12 pelotas en una fila, iniciando con las azules, luego con las blancas y luego con
las celestes. Hecho esto, podrı́amos etiquetar las azules, degamos del a1 al a3 , las blancas del
b1 al b4 y las celestes del c1 al c5 . Las etiquetas son un elemento auxiliar que nos permitirán
distinguir entre configuraciones que difieren sólo por el intercambio de posiciones de pelotas del
mismo color. Ası́, con las etiquetas puestas, ya sabemos que hay 12! configuraciones posibles
con las 12 pelotas. Pero sabemos también que hay 3! configuraciones que difieren sólo por
un intercambio de las posiciones de las pelotas azúl, ası́ mismo hay 4! configuraciones que
sólo difieren por el intercambio entre las blancas y 5! configuraciones que sólo varı́an por el
intercambio de las celestes. Entonces, el total de configuraciones sin distinguir aquellas que
ocurren por intercambio de pelotas del mismo color será
                                                  12!
                                                        .
                                                 3!4!5!
   Los arreglos de este tipo, en que existen objetos que son indistinguibles, se denominan
permutaciones con repeticiones. Podemos generalizar el argumento usado en el ejemplo
anterior para una cantidad finita de n objetos, clasificados en k < n tipos diferentes, donde,
para cada i = 1, 2, . . . , n tenemos ni objetos del tipo i. La cantidad total de ordenamientos que
podemos tener será entonces
                                                               n!
                                   Pnn1 ,n2 ,...,nk =                       .                 (5.2)
                                                        n1 !n2 ! · · · nk !
   Consideremos ahora el siguiente problema de conteo. Supongamos que tenemos n casillas
                                                    90
alineadas y queremos colocar en ellas m objetos indistinguibles. No hay restricción respecto de
cuántos objetos pueden colocarse en una misma casilla. Nos interesa saber de cuántas formas
podemos realizar dicha asignación. Podemos pensar que las casillas están definidas por n + 1
barras verticales, y los m objetos como estrellas que repartimos entre dichas barras, lo que nos
da una configuración como la siguiente
| ⋆ | ⋆ ⋆ ⋆ | ⋆ ⋆| − | ⋆ | · · · | ⋆ ⋆|,
   donde la lı́nea horizontal representa una casilla no ocupada. Notamos entonces que la
repartición propuesta equivale a cambiar de orden los m + n − 1 objetos conformados por las
m estrellas y las n − 1 barras intermediarias, dado que las de los extremos quedan fijas. El
número total de ordenamientos que podemos tener de estos objetos es (m+n−1)!, pero debemos
dividirlo entre m! porque los intercambios entre estrellas no los distinguimos, y también hay
que dividir entre (n − 1)!, porque tampoco distinguimos los intercambios entre las barras. Ası́,
nos queda
                                        (m + n − 1)!
                                                     ,
                                          m!(n − 1)!
como la cantidad total de formas en que podemos repartir los m objetos en n casillas. Este
tipo de arreglo también ocurre con suficiente frecuencia para merecer un nombre, y se lo conoce
como combinación con repetición de n elementos tomados de m en m. De forma
abstracta, lo que tenemos es un conjunto con n elementos (piense en las casillas), y queremos
formar con sus elementos grupos de tamaño m (piense en las estrellas del problema anterior), y
queremos permitirnos repetir elementos del conjunto (eso equivale a colocar más de una estrella
en una misma casilla). La cantidad de arreglos diferentes es entonces
                                       n         (m + n − 1)!
                                     CRm =                    .                            (5.3)
                                                  m!(n − 1)!
                                                   91
          (a + b)3 = (a + b)(a + b)2 = (a + b)(a2 + 2ab + b2 ) = a3 + 3a2 b + 3ab2 + b3 ,
identidades que pueden verificarse fácilmente aplicando las propiedades distributiva y conmu-
tativa.
    Nuestro objetivo ahora es encontrar una expansión similar para n genérico. Para ello,
observemos que
                            (a + b)n = (a + b) · (a + b) · · · (a + b),
donde tenemos n factores (a + b). Para obtener la expresión desarrollada debemos elegir un
elemento en cada factor, ya sea a o b, multiplicarlos para obtener una expresión de la forma
an−m bm , y luego sumar todas estas expresiones reduciendo términos semejantes. Entonces lo
que necesitamos saber es cuántos términos semejantes hay de la forma an−m bm , pues dicha
cantidad serı́a el coeficiente de este término. En cada uno de dichos términos semejantes
aparece la misma cantidad (n − m) de factores a y la misma cantidad m de factores b. Por
tanto, cada uno de los términos semejantes an−m bm es una permutación con repeticiones de n
objetos de los cuales (n − m) son del tipo a y m son del tipo b. Sabemos que la cantidad de
tales permutaciones con repeticiones que podemos tener es
                                                          
                                  n             n!         n
                                P(n−m),m =             =       .                         (5.4)
                                            (n − m)!m!     m
    Veamos, en particular, que la única forma de lograr an es escogiendo a en cada uno de los
factores (a+b), y esto puede hacerse de una sola forma. En la fórmula anterior, esto corresponde
a m = 0, es decir                         
                                           n     n!
                                              =     = 1.
                                           0     n!
Ası́ mismo, la única forma de tener bn es escogiendo b en cada uno de los fatores (a + b), y eso
corresponde a tomar m = n en la igualdad 5.4, es decir
                                             
                                              n
                                                 = 1,
                                              n
                                                            n
                                                              
   Esta expresión es la razón por la cual a los números m    se los conoce también como
coeficientes binomiales. Como una aplicación simple del binomio de Newton tenemos la
identidad           n                                 
                   X     n       n      n               n        n
                             =       +      + ··· +         +        = 2n ,             (5.6)
                   m=0
                         m       0       1            n − 1      n
                                                92
                  n=0                                       1
                  n=1                                  1         1
                  n=2                              1        2            1
                  n=3                      1           3         3                1
                  n=4                  1           4        6            4            1
                  n=5              1       5           10        10               5       1
                  n=6          1       6       15           20           15           6           1
                                    Figure 5.1: Triángulo de    Pascal
                                                         0
                                                          
         n=0                                          0
                                                    1             1
                                                                     
         n=1                                    0                1
                                              2          2                   2
                                                                             
         n=2                                  0          1                   2
                                        3           3             3                   3
                                                                                   
         n=3                            0           1             2                   3
                                   4          4          4                   4            4
                                                                                          
         n=4                       0      1          2                     3            4
                           5            5           5             5                   5               5
                                                                                                   
         n=5               0            1           2             3                   4               5
                     6             6          6          6                   6            6               6
                                                                                                    
         n=6         0             1           2            3                4            5               6
Ejercicio 5.3.1. Muestre que un conjunto con n elementos tiene exactamente 2n subconjuntos.
Use este resultado para obtener otra prueba de la identidad (5.6).
                                                       93
                                                                                CAPÍTULO         6
Álgebra Matricial
Las matrices son arreglos rectangulares de números (reales o complejos) que aparecen en muchas
aplicaciones de las matemáticas en ciencias e ingenierı́as. En este capı́tulo daremos la definición
de matrices, identificaremos algunos tipos especiales de matrices y definiremos cómo realizar
operaciones de suma y multiplicación de matrices. Una vez definidas la suma y producto
de matrices, estaremos interesados en determinar qué tipos de propiedades satisfacen estas
operaciones, eso es lo que se denomina álgebra matricial. Veremos que se satisfacen algunas
propiedades familiares similares a las que se cumplen con los números reales (o complejos), y
veremos que hay algunas propiedades que dejan de ser válidas en el contexto matricial. De
entre todas las aplicaciones de las matrices, una que será de espacial importancia para nosotros
es su conexión con los sistemas de ecuaciones lineales, que veremos en el siguiente capı́tulo,
luego de establecer el lenguaje básico de las matrices y su álgebra. Como fuente de ejercicios
el lector puede consultar las referencias [9, 1, 3].
A : Jm × Jn → K .
                                                 94
                                             A(i, j) = aij .
   Recordemos, del capı́tulo anterior, que |Jm × Jn | = |Jm | · |Jn | = mn. Ası́, conocer completa-
mente la matriz A : Jn × Jn → K equivale a conocer su valor en los mn elementos (i, j) del pro-
ducto cartesiano Jm × Jn . Es útil adoptar una notación especial para la matriz A : Jm × Jn → K
ordenando sus valores A(i, j) = aij en un arreglo rectangular encerrado entre paréntesis o
corchete, como sigue:                                          
                                      a11    a12   ···     a1n
                                     a21    a22   ···     a2n 
                                                               
                                     .
                                     .       ..   ..        ..                              (6.1)
                                      .       .      .       . 
                                                                
                                     am1    am2    ···     amn
Dado que la función A : Jm ×Jn → K queda completamente determinada una vez que conocemos
todos los valores A(i, j) = aij , es común identificar el arreglo rectangular indicado en (6.1) con
la matriz A : Jm × Jn → K, y escribir
                                                                    
                                    a11          a12      ···    a1n
                                   a21          a22      ···    a2n 
                                                                    
                                A=
                                   ..            ..      ..      ..                          (6.2)
                                   .              .         .     . 
                                                                     
                                       am1       am2      ···    amn
En esta notación, a los números aij se los denomina la entrada ij de la matriz A. También
diremos que la matriz A expresada en (6.2) tiene m filas y n columnas. Al conjunto de todas
la matrices m × n con entradas en K usualmente se la denota mediante Mm×n (K).
La matriz A es 3 × 2 y tiene entradas reales, es decir, es un elemento del conjunto M3×2 (R). La
matriz B es 2 × 4 y tiene entradas complejas, es decir, es un elemento del conjunto Mm×n (C).
    Si A y B son dos matrices m × n con entradas en K, dado que son funciones, entonces
tendrı́amos A = B si aij = A(i, j) = B(i, j) = bij para todo elemento (i, j) ∈ Jm × Jn . En
la notación de arreglo rectangular esto ocurre si, y sólo si, las entradas correspondientes a la
misma posición ij son iguales.
    La matriz O : Jm × Jn → K definida mediante O(i, j) = 0 para todo (i, j) ∈ Jm × Jn se
denomina matriz nula. En la notación de arreglo rectangular corresponde a un arreglo en el
cual todas las entradas son nulas.
                                                   95
6.2      Operaciones con matrices
Definiremos ahora algunas operaciones entre matrices y exploraremos sus propiedades básicas.
Estas propiedades nos facilitarán las manipulaciones algebraicas con matrices, y nos permitirán
también explorar una primera situación en que propiedades familiares de los números y sus
operaciones dejan de ser válidas.
αA : Jm × Jn → K; (αA)(i, j) = αaij .
A + B = B + A.
(A + B) + C = A + (B + C).
A + O = A.
  d) Dada una matriz A, la matriz −A cuyas entradas son los negativos de las entradas de A
     es el opuesto aditivo de A, es decir
A + (−A) = O.
                                                96
  e) El producto por escalar distribuye sobre la suma de escalares. Esto es, si α y β son
     escalares, y A es una matriz, entonces
(α + β)A = αA + βA.
  f ) El producto por escalar distribuye sobre la suma de matrices. Esto es, si α es un escalar,
      y A y B son matrices, entonces
α(A + B) = αA + αB.
   g El producto por escalar y el producto entre escalares es asociativo. Esto es, si α y β son
     escalares y A es una matriz, entonces
(αβ)A = α(βA).
Prueba. Probaremos algunas de las propiedades, a modo de ejemplo. Las restantes quedan
como ejercicio.
     La expresión del lado derecho es la entrada ij de la matriz αA + βA. Ası́, concluimos que
     (α + β)A = αA + βA.
                                                     97
                                               
                        a11 a12      · · · a1n                                      
                       .
                       ..   ..      ..     ..      b11   · · · b1j       · · · b1p
                              .          .   . 
                                                  b21
                                                         · · · b2j       · · · b2p 
                                                                                    
                       ai1 ai2      · · · ain  ·                                    ,   (6.4)
                      
                                                    ..    ..     .
                                                               . ..
                                                                           ..     .. 
                                                                               . . 
                       .
                       ..    ..     ..      ..    .
                                         .
                                                                                     
                               .              . 
                                                
                                                    bn1   · · · bnj       · · · bnp
                       am1 am2       · · · amn
donde la matriz de la izquierda es A y la de la derecha es B. Para obtener la entrada cij de
AB la i-ésima fila de A (resaltada en rojo) y la j-ésima columna de B (resaltada en rojo) se
multiplican componente a componente y los resultados de esos productos se suman entre sı́.
Tenemos                                         "   #
                                             6 6 1
                                        AB =          .
                                             2 −4 0
Vemos que si bien podemos calcular AB y BA, los resultados son diferentes. De hecho, ni
siquiera son matrices de las mismas dimensiones.
                                                    98
Ejemplo 6.2.4. Consideremos las siguientes matrices
                                 "       #         "    #
                                    3 1             0 1
                            A=             ; B=           .
                                   −4 0             2 3
Nuevamente, las dimensiones de las matrices nos permiten calcular tanto AB como BA. Obten-
emos lo siguiente:                 "      #           "      #
                                     2 6                −4 0
                           AB =             ; BA =             .
                                     0 −4               −6 2
En este caso, si bien las matrices AB y BA tienen las mismas dimensiones, ellas no son iguales.
Observación 40. Lo que se ilustra en los dos ejemplos precedentes es una de las caracterı́sticas
principales del producto de matrices: la operación no es conmutativa. Esto contrasta con lo
que estamos acostumbrados a tener con el producto de números en todos los conjuntos numéricos
N, Z, Q, R, C, que hemos visto hasta ahora.
  d) Si A es m × n, entonces
                                             Im A = A = AIn .
Prueba. La verificación de estas propiedades (que queda como ejercicio) consiste en aplicar la
fórmula para producto de matrices, y constatar que en cada igualdad propuesta, las entradas
en posiciones ij correspondientes coinciden.
                                                  99
    El ı́tem d) de la Proposición 6.2.5 plantea una cuestión interesante. Recordemos que en
los conjuntos numéricos, la existencia de un elemento identidad para el producto nos llevaba a
plantearnos si un determinado número tendrá o no un inverso en relación al producto. Hemos
visto que en Z no tenemos inversos multiplicativos, pero sı́ los tenemos en Q, R y C.
    Dado que las matrices identidades actuan como neutros para el producto matricial, podrı́amos
plantearnos si dada una matriz A de dimensión m×n, habrá otra, digamos B que sea su inverso
multiplicativo. Lo primero que debemos notar es que al ser m ̸= n, podemos tener una matriz
B de dimensión n × m y otra matriz C de dimensión n × m que nos permitan realizar los
productos AB y CA, resultando en matrices m × m y n × n, respectivamente.
    Diremos que la matriz B de dimensión n × m es una inversa a derecha de A si
AB = Im .
CA = In
   A cualquiera de las inversas (por izquierda o por derecha) se las llama inversas laterales.
No toda matriz tiene ambas inversas laterales, y cuando tiene una invesa lateral, puede que no
sea única, como ilustramos en el siguiente ejercicio.
                                      1 0                  1 0
ambas satisfacen AB = AC = I2 .
   Ası́, la matriz A admite más de una inversa lateral derecha. Por otro lado, no admite
inversa lateral izquierda, pero para comprender por qué, necesitamos conceptos de sistemas de
ecuaciones lineales.
                                                100
primera obervación del porqué las matrices cuadradas merecen un destaque es que el producto
de dos matrices n-cuadradas es nuevamente una matriz n-cuadrada. Ası́, el conjunto Mn×n (K),
es cerrado para la operación de producto matricial. Y en este caso, existe una sola matriz
identidad In ∈ Mn×n , la cual actua como neutro para el producto matricial, es decir
AIn = A = In A,
para cualquier matriz n-cuadrada A. También, para una matriz n-cuadrada A podemos iden-
tificar elementos relevantes, como su diagonal principal, consitente de las entradas aii , y la
diagonal secundaria, consitente de las entradas aij tal que i + j = n + 1. La traza de una
matriz n-cuadrada A es la suma de los elementos de su diagonal principal.
     Si A es una matriz n-cuadrada y admite ambas inversas laterales, entonces decimos que A
es invertible. En este caso, las inversas laterales por la izquierda y por la derecha coinciden,
es decir
                                 CA = In = AB =⇒ B = C.
   En particular, si A es una matriz n-cuadrada que admite inversas laterales por izquierda y
por derecha, entonces existe una única matriz X que satisface la ecuación
AX = In = XA. (6.5)
Observación 41. Notemos que la ecuación (6.5) caracteriza a la iversa de A. Esto es, es útil
cuando tenemos una matriz Y que es candidata a ser inversa de A, pues bastará sustituir la X
en la expresión AX con la matriz Y y determinar si el resultado es o no la identidad In .
   Entre las matrices cuadradas tenemos otras con caracterı́sticas adicionales relevantes, como
son las triangulares. Estas son matrices n-cuadradas cuyas entradas, o bien por debajo de la
diaginal principal o bien por arriba de la diagonal principal, son todas nulas. Esto se formaliza
de la siguiente forma: una matriz n-cuadrada A es triangular superior si aij = 0 siempre
que i > j y es triangular inferior si aij = 0 siempre que i < j.
Vemos que A es triangular superior, en tanto que B es triangular inferior. Note que las matrices
triangulares pueden tener elementos nulos en su diagonal principal.
                                                 101
Ejemplo 6.3.2. Las siguientes matrices son diagonales
                                                                   
                                                  1      0   0 0
                                  1 0 0            0      0   0 0 
                            A = 0 3 0  ;       B=                .
                                                                 
                                                   0      0   2 0 
                                  0 0 2i                         √
                                                    0      0   0   2
(AB)T = B T AT .
6.3.1     Determinante
Para las matrices n-cuadradas podemos definir el concepto de determinante. Históricamente los
determinantes surgieron en el contexto de la resolución de sistemas de ecuaciones lineales. Más
tarde, con el desarrollo de la teorı́a de matrices se encontró que el concepto de determinante está
estrechamente ligado a las matrices y codifica información sobre las mismas, y está asociado a
una interpretación geométrica.
    Existen varias formas equivalentes de definir el determinante de una matriz n-cuadrada. Una
de ellas es mediante una fórmula explı́cita, y no es recomendable por al menos dos razones:
la primera es que usa nociones de combinatoria que no hemos estudiado, y la segunda es que
es muy ineficiente desde el punto de vista computacional. Otra opción para introducir los
determinantes es tomar un enfoque axiomático, a partir de propiedades básicas que deseamos
que satisfaga. Este es el enfoque más eficiente, pero apela a conceptos sofisticados que sólo
                                                102
serán estudiados en cursos posteriores. Una tercera alternativa, intermediaria entre las dos ya
mencionadas, toma un enfoque recursivo. Esto quiere decir que la definición del determinante
de una matriz n-cuadrada queda en términos de la definición para una matriz (n − 1)-cuadrada.
Es esta tercera alternativa la que tomaremos en este curso.
    La idea de la definición recursiva es reducir el determinante de una matriz n-cuadrada al
determinante de una situación base. En este caso, tomamos el caso n = 2 como el caso base, y
definimos el determinante de una matriz A de dimensión 2 × 2 como
Con el determinante de matrices 2×2 ya definido, podemos avanzar hacia la definición recursiva
para matrices n-cuadradas, con n > 2. Antes, necesitamos introducir un par de conceptos
relacionados.
     Dada una matriz una matriz n-cuadrada, A, el menor asociado a la entrada aij , denotado
Mij es el determinante de la matriz (n − 1)-cuadrada que se obtiene al eliminar de A su i-ésima
fila y su j-ésima columna. El cofactor del elemento aij , denotado por Cij , se define como
cuyo resultado será el mismo que el correspondiente a la expansión dada en (6.8). Ası́ mismo,
                                                 103
en lugar de expandir por una fila, podemos expandir por una columna. Ası́, si tomamos la
j-ésima columna, obtendremos la expansión
Todas estas expansiones dan el mismo resultado numérico, y dicho número invariante es lo que
denominamos det(A). El hecho de que todas estas expansiones dan el mismo resultado es una
propiedad que no demostraremos en este curso.
   La segunda observación, de caracter más práctico, es que para realizar los cálculos conviene
tomar la expansión por la fila o columna que contenga la mayor cantidad de elementos nulos,
pues la sumatoria quedará con menos sumandos a ser calculados.
3 5 1
donde
Vemos que la columna 3 contiene más ceros que cualquier otra columna o fila. Entonces con-
viene realizar la expansión en cofactores por esta columna, obteniendo
                                                    104
donde
                                              M13 = det(A13 ),
siendo                                                   
                                                     0 2 3
                                            A13   = 2 1 5 .
                                                         
0 7 9
    Aquı́, vemos que la primera columna es la que más ceros contiene, y por lo tanto conviene
calcular det(A13 ) expandiendo por su primera colmuna, obteniendo ası́:
Proposición 6.3.6. El determinante de una matriz n-cuadrada satisface las siguientes propiedades.
a) det(In ) = 1.
  b) Dada una matriz A, lo escribiremos como A = [A∗1 |A∗j | · · · |A∗n ], donde A∗j indica la
     j-ésima columna de A. Si la j-ésima columna de A es de la forma
                                                    
                                           b1j + c1j
                                          b2j + c2j 
                                                    
                                 A∗j =       ..     = B∗j + C∗j ,
                                                .
                                                     
                                                    
                                                  bnj + cnj
entonces
  c) Si todos los elementos de una columa de A se multiplican por una constante c, entonces
     el determinate de A queda multiplicado por c.
                                                      105
  g) A es invertible si y sólo si det(A) ̸= 0, y en ese caso se tiene det(A−1 ) =      1
                                                                                     det(A)
                                                                                            .
j) det(A) = det(AT ).
    Lo que propone el método de Sarrus es repetir las primeras dos columnas inmediatamente
a la derecha de la tercera columna, para obtener un arreglo ampliado como el siguiente:
                                               106
Ahora, se procede a multiplicar entre sı́ las entradas conectadas por flechas, asignando signo
positivo a las que se conectan por flechas sólidas y signo negativo a las que se conectan por
flechas segmentadas. El determinante de A será entonces la suma algebraica de todos esos
productos.
   El método de Sarrus es práctico para matrices 3 × 3 con pocas o ninguna entrada nula. Pero
cuando hay muchas entradas nulas, puede ser más rápido calcular el determinante mediante la
expansión de Laplace.
                                             107
                                                                             CAPÍTULO        7
Sistemas Lineales
En esta unidad estudiaremos los sistemas de ecuaciones lineales con dos objetivos en mente.
El primero es comprender los sitemas de ecuacciones lineales en un un lenguaje matricial, y
el segundo es aprender un método de resolución muy versátil, conocido como eliminación
gaussiana. Para profundizar el concepto y como fuente de ejercicios, el lector puede consutlar
las referencias [9, 1, 3].
    Recordemos la interpretación geométrica de un sistema de dos ecuaciones lineales con dos
incógnitas. Tomemos como ejemplo el siguiente sistema
                                          2x − y = 1,
                                                                                            (7.1)
                                           x + y = 5.
Resolver este sistema consiste en determinar todos los pares (x, y) ∈ R2 tales que al sustituir
los valores de x e y en las ecuaciones que conforman el sistema, la igualdad sea verificada.
Puede ocurrir, como es el caso de este ejemplo, que exista una única solución (x, y) ∈ R 2.
Geométricamente esto está claro, pues las ecuaciones dadas definen rectas en el plano, y los
pares (x, y) ∈ R2 que satisfacen ambas ecuaciones son precisamente los puntos del plano que
están al mismo tiempo sobre ambas rectas, es decir, son los puntos donde estas rectas se
intersecan, y vemos que eso ocurre en un solo punto (ver Figura 7.1 ), que en este caso es el
punto (2, 3)
    Con la interpretación geométrica, es fácil observar que pueden haber sistemas lineales que
no tienen solución, como el del siguiente ejemplo
                                           x − y = 0,
                                                                                            (7.2)
                                           x − y = 2,
                                              108
                              Figure 7.1: Gráfica del sistema (7.1)
el cual corresponde a dos rectas paralelas en el plano. También podrı́amos tener sistemas con
infinitas soluciones, como serı́a el caso del siguiente ejemplo
                                            2x + y = 5,
                                                                                               (7.3)
                                          4x + 2y = 10.
    Pues corresponde a “dos rectas que coinciden”, y por lo tanto cualquier par (x, y) ∈ R2 que
satisfaga una de las ecuaciones, satisfará también la otra.
    Si consideramos sistemas de tres ecuaciones con tres incógnitas, la interpretación geométrica
nos conduce a considerar planos en el espacio R3 . Concretamente, un sistema de 3 ecuaciones
con 3 incógnitas, de la forma
donde los aij , bi son constantes, corresponde a 3 planos en el espacio R3 . Resolver este sistema
consiste en determinar todas las ternas (x, y, z) ∈ R3 que satisfacen simultáneamente las 3
ecuaciones. Geométricamente, esto significa determinar todos los puntos (x, y, z) ∈ R3 que
pertenecen simultáneamente a los 3 planos. En este caso, las constantes aij , bi definen las
posiciones relativas de dichos planos, y dependiendo de dichas posiciones relativas, tendremos
que el sistema pueden no tener soluciones, tener una única solución, o tener infinitas. En la
Figura 7.2, ilustramos (las trazas de) algunas situaciones en las cuales el sistema o bien no
admite solución, o admite infinitas. Podrı́a decidir en cada caso si no hay solución o si hay
infinitas?
    En cursos previos se estudian métodos para resolver sistemas de ecuaciones lineales de
hasta 3 ecuaciones con 3 incógnitas. En esta unidad introduciremos el método de Gauss,
que nos permitirá analizar sistemáticamente sistemas de ecuaciones sin importar la cantidad
                                                109
           Figure 7.2: Trazas de varias posiciones relativas de 3 planos en el espacio
donde los aij , bi son todos elementos constantes de K. Una solución de este sistema es una
lista ordenada (x1 , x2 , . . . , xn ) ∈ Kn tal que al sustituir los valores de cada xj en las ecuaciones
del sistema, todas ellas se verifican. Si llamamos S al sistema dado en la (7.5), el conjunto
solución de S, que denotaremos mediante C(S) es el conjunto formado por todas las soluciones
del sistema S. El sistema S se denomina compatible, o consistente si su conjunto solución es
no vacı́o (es decir, cuando el sistema admite al menos una solución). El sistema S se denomina
inconsistente o incompatible si su conjunto solución es vacı́o (es decir, si el sistema no
admite solución). Entre los sistemas compatibles, podemos diferenciar dos casos: aquellos en
los cuales la solución es única, en cuyo caso decimos que el sistema es determinado, y aquellos
en los cuales el sistema admita infinitas soluciones, en cuuyo caso decimos que el sistema es
indeterminado.
    Dos sistemas S y S ′ se denominan equivalentes si tienen el mismo conjunto solución, esto
es, si C(S) = C(S ′ ). Esto significa que toda solución del sistema S es también solución del
sistema S ′ , y toda solución del sistema S ′ es también solución del sistema S. El concepto
de equivalencia es clave para el método de resolución que estudiaresmos, pues básicamente
consiste en aplicar transformaciones a un sistema de tal manera a transformarlo a un sistema
                                                   110
equivalente, pero que sea fácil de resolver.
    Dado un sistema triangular, es fácil determinar si el mismo es compatible o no, pues será
compatible y determinado si y sólo si ann ̸= 0. En tal caso, también es fácil obtener la
solución del sistema mediante el proceso conocido como sustitución para atrás, que consiste
en despejar xn de la última ecuación, obteniendo su valor
                                                        bn
                                                xn =       ,
                                                       ann
luego se procede a sustituir este valor en la ecuación previa, de donde se puede despejar xn−1
para obtener su valor
                                          1
                             xn−1 =               (bn−1 − a(n−1)n xn ).
                                      a(n−1)(n−1)
A continuación se sustituyen los valores obtenidos de xn y xn−1 en la ecuación número (n − 2),
de donde se despeja la incógnita xn−2 . Prosiguiendo de esta forma, se terminará por determinar
el valor de cada incógnita, desde xn hasta x1 .
                                                   111
Ejemplo 7.1.1. El sistema de ecuaciones lineales
                                        3x1 + x2 − 2x3 = 2,
                                        2x1 + x2 + 4x3 = 1,                                   (7.7)
                                       6x1 + 2x2 + 3x3 = 3,
                                       3x1 + x2 − 2x3 = 2,
                                            x2 + 16x3 = −1,                                   (7.8)
                                                    7x3 = −1.
Esto significa que el conjunto solución de ambos sistemas son lo mismo. No es evidente cómo
obtener la solución del primer sistema, pero en el segundo sistema podemos aplicar la sustitución
para atrás, que hemos decrito previamente. Ası́, de la última ecuación del sistema triangular
obtenemos
                                                     1
                                             x3 = − ,
                                                     7
lo cual sustituimos en la ecuación previa para obtener
                                              
                                                1       −7 + 16    9
                              x2 = −1 − 16 −         =           = .
                                                7          7       7
    En el ejemplo anterior se nos proveyó la información adicional de que los sistemas son
equivalente, y por lo tanto procedimos a resolver el sistema triangular, en lugar del sistema
original. El método de Gauss, que estudiaremos en breve, es la herramienta para transformar
cualquier sistema de ecuaciones lineales consistente y determinado a uno triangular equivalente,
y por lo tanto nos da la posibilidad de resolverlo mediante sustitución para atrás. Antes de
pasar a estudiar este método, explicaremos cómo representar un sistema de ecuaciones lineales
en notación matricial.
                                                  112
7.1.1    Sistema de ecuaciones lineales en notación matricial
Consideremos de nuevo un sistema de n ecuaciones lineales en Kn ,
                                                113
convendra introducir la siguiente notación: pongamos Ei para designar a la i-ésima ecuación
del sistema, comenzando a contar desde arriba. Ası́, las transformaciones elementales de Gauss
son las siguientes:
   I) Intercambiar de posiciones dos ecuaciones. Podemos representar esto como
Ei ↔ Ej .
  II) Multiplicar una ecuación por una constante α ∈ K no nula. Podemos representar esto
      como
                                            Ei ←[ αEi .
 III) Sustituir una ecuación por ella misma más un múltiplo de otra ecuación. Podemos rep-
      resentar esto como
                                           Ei ←[ Ei + αEj .
                                        3x1 + x2 − 2x3 = 2,
                                        2x1 + x2 + 4x3 = 1,                                  (7.12)
                                       6x1 + 2x2 + 3x3 = 3,
En los primeros dos pasos el objetivo es modificar la segunda y la tercera ecuación de tal forma
que en ellas desaparezca la incógnita x1 . Podemos lograr eso mediante las transformaciones
tipo III siguientes:
                                                   2
                                         E2 ←[ E2 − E1
                                                   3                                         (7.13)
                                                   6
                                         E3 ←[ E3 − E1 .
                                                   3
                                                114
Al ejecutar estos pasos, obtenemos el sistema equivalente
                                      3x1 + x2 − 2x3 = 2,
                                         1      16        1
                                           x2 + x3 = − ,                                     (7.14)
                                         3      3         3
                                                 7x3 = −1,
                                      3x1 + x2 − 2x3 = 2,
                                            x2 + 16x3 = −1,                                  (7.15)
                                                  7x3 = −1.
Entonces, las transformaciones elementales sobre las ecuaciones Ei del sistema dado, se pueden
interpretar como transformaciones elementales sobre las filas de la matriz [A|b]. Concretamente,
si denotamos por Fi la i-ésima fila de [A|b], las transformaciones elementales se pueden expresar
como
   I) Fi ↔ Fj .
                                                115
  II) Fi ←[ αFi , con α ̸= 0.
III) Fi ←[ Fi + αFj .
El método de Gauss culminará entonces con una matriz aumentada de la forma [U |c], donde U
será triangular superior, y c será un nuevo vector de términos independientes, resultado de las
transformaciones realizadas sobre b. Esta matriz aumentada [U |c] corresponderá a un sistema
triangular, en la que la i-ésima ecuación se corresponde con la i-ésima fila de U y la incógnita
xj se corresponde con la j-ésima columna de U , y la sustitución para atrás podrá aplicarse par
determinar el valor de las incógnitas. En el ejemplo que hemos trabajado, tenemos
                                                        
                3 1 −2 | 2    3 1 −2 | 2          3 1 −2 | 2
       [A|b] = 2 1 4 | 1 → 0 13 16 | − 13  → 0 1 16 | −1 = [U |c]
                                                        
                                    3
                6 2 3 | 3     0 0 7 | −1          0 0 7 | −1
En la última matriz, cada fila corresponde a una ecuación del sistema triangular 7.15, y podemos
colocar de nuevo las incógnitas para despejarlas y obtener su valor mediante sustitución para
atrás.
Observamos que el método de Gauss puede pensarse como un procedimiento para transformar
una matriz dada a una matriz triangular. Si lo aplicamos sobre la matriz aumentada de un
sistema de ecuaciones lineales, nos permite obtener un sistema triangular equivalente, y ası́
resolverlo por sustitución para atrás. Por otro lado, la posibilidad de transformar una matriz
a una triangular, sugiere que podrı́amos también aplicar el método de Gauss para el cálculo
de determinantes. De forma simplificada la idea es, dada una matria n-cuadrada A, aplicarle
una sucesión de transformaciones elementales hasta transformarla en una matriz U , triangular.
En las propiedades de determinantes hemos visto que para la matriz U , su determinante es
simplemente el producto de elementos en su diagonal, y lo que necesitamos ahora es hacer un
seguimiento de las transformaciones que hemos realizado, a fin de determinar el determinante
                                                116
de A partiendo del determinante de U y aplicando las propiedades de los determinantes cuando
la matriz pasa por ciertas transformaciones.
   De forma más concreta, lo que tendremos es el siguiente esquema
A → U,
donde m es la cantidad de veces que hemos aplicado transformación tipo I) y losαi corresponden
a los múltiplos empleados las veces que hayamos aplicado transformaciones tipo II). Por su
parte, sabemos que det(U ) es el producto de sus elementos diagonales. Ası́, tenemos
                                                       det(U )
                                  det(A) = (−1)m                    .
                                                     α1 α2 · · · αr
Por lo general, no es necesario aplicar transformaciones tipo II), y entonces, sólo es necesario
llevar en cuenta la cantidad m de intercambios de filas realizados, y tendremos
Primero anulamos todas las entradas debabo de a11 = 2. Para ello, realizamos, para i = 2, 3, 4
las transformaciones
                                         ai1           ai1
                              Fi ←[ Fi −     F2 = Fi −     F2 .
                                         a11            2
                                               117
Obtenemos la matriz                                  
                                            2 3  1 −2
                                          0 −5 1 −1
                                     A1 =            .
                                                     
                                               3  7
                                          0 2    2
                                                    3
                                            0 −7 −1 7
Para no sobrecargar la notación, a las entradas de A1 las seguiremos denominando aij . Ahora
el objetivo es anular todas las entradas por debajo de la entrada a22 = −5. Para ello, realizamos
para i = 3, 4 las transformaciones
                                               ai2           ai2
                                  Fi ←[ Fi −       F1 = Fi +     F1 .
                                               a22            5
Ası́, dado que sólo aplicamos transformaciones tipo III) tenemos, para la matriz original A
                                                            19 192
                           det(A) = det(U ) = 2 · (−5) ·      ·    = −384.
                                                            5 19
Observación 48. El método de Sarrus para el cálculo de determinante no puede extenderse
para matrices n×n, con n > 3. Por su parte, tanto la expansión por cofactores de Laplace como
el método de Gauss funcionan para cualquier valor de n. Cuál de ellos conviene usar? Para
responder esta pregutna se puede considerar el “costo computacional” de cada método tomando
en cuenta la cantidad de operaciones productos/divisiones y sumas/restas que se deben realizar
para llegar al resultado. El método de Laplace tiene un costo computacional proporcional a
n!, en tanto que el método de Gauss tiene un costo computacional proporcional a n3 . Cómo
se comparan estos costos? Para n ≤ 5, tenemos n3 ≥ n!, concretamente n = 5 implica
53 = 125 > 120 = 5!. Pero a partir de ahı́, n3 es insignificante en comparación con n!. Para
n = 6, tenemos 63 = 216 < 720 = 6!. Para n = 10, tenemos 103 = 1.000 << 3.628.800 = 10!.
                                                 118
De momento, para ejercicios manuales no trabajaremos con matrices n × n para n más allá
de 5, ası́ que los métodos de Laplace y Gauss pueden considerarse emparejados, y cuando la
matriz tiene muchos ceros en filas o columnas, el método de Laplace puede dar una respuesta
más rápida. En aplicaciones de ingenierı́a, sin embargo, frecuentemente aparecen matrices
n × n con n en el orden de miles. Para estos casos, el método de Laplace es absolutamente
impracticable, ni con toda la potencia computacional del mundo puesta a trabajar en simultáneo.
Incluso el método de Gauss puede llegar a ser computacionalmente costoso, y por lo tanto se
estudian otros métodos más sofisticados que ofrezcan una mayor eficiencia.
siendo U una matriz n × n triangular superior, que se obtiene anulando progresivamente las
entradas por debajo de las posiciones pivotales. Llegado a este punto, podrı́amos seguir trans-
formado el sistema mediante la aplicación de las transformaciones elementales, de tal forma a
anular también las entradas por encima de las posiciones pivotales, con lo cual tendrı́amos un
esquema como el siguiente
                                    [A|b] → [U |c] → [D|d],
donde D es una matriz n × n diagonal. Multiplicando cada fila de [D|d] por el inverso de la
entrada diagonal (transformación tipo II), llegamos finalmente a un esquema como el siguiente
Recordemos que dada una matriz n-cuadrada A, su inversa, denotada A−1 , es la única matriz
que satisface la ecuación
                                     A · X = In .
Para explicar cómo se usa el método de Gauss-Jordan para hallar A−1 denotaremos las columnas
de In como ej , que corresponde a una matriz n × 1 que tiene 0 en todas las entradas, excepto
                                                119
en la j-ésima, que es 1. Ası́, podemos escribir In = [e1 |e2 | · · · |en ]. Reescribamos la ecuación
matricial A · X = In como
obtendremos
                                     [In |x1 |x2 | · · · |xn ] = [I|A−1 ].
Resumiendo, tenemos
                                           [A|In ] → [In |A−1 ],
                                                     120
                                                                               Bibliografı́a
Textos básicos
 [2] Samuel Fuenlabrada and Irma Fuenlabrada. Aritmética y Álgebra. McGraw-Hill, 2013.
 [3] José Giovanni et al. Matemática Fundamental, Vol. FTDl, 1998.
 [6] Seymour Lipschutz. Teorı́a de Conjuntos y Temas Afines. McGraw-Hill, 1991.
 [9] Dennis Zill and Jacqueline Dewar. Álgebra, Trigonometrı́a y Geometrı́a Analı́tica. McGraw-
     Hill, 2012.
[10] Dennis Zill and Jacqueline Dewar. Precálculo. McGraw-Hill, 2012.
Textos intermediarios
 [1] Frank Ayres Jr. Matrices. McGraw-Hill, 1999.
 [4] Paul Halmos. Naive Set Theory. Springer, 1960.
 [5] Seymour Lipschutz. Matemáticas Finitas. McGraw-Hill, 1972.
 [7] Seymour Lipschutz and Marc Lipson. Matemáticas Discretas. McGraw-Hill, 2009.
 [8] Murray Spiegel et al. Variable Compleja. McGraw-Hill, 1992.
121