Artículos

3: Álgebra y electrodinámica de Pauli - Matemáticas

3: Álgebra y electrodinámica de Pauli - Matemáticas


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

  • 3.1: Transformación de Lorentz y fuerza de Lorentz
    La principal importancia del álgebra de Pauli es proporcionarnos un trampolín para la teoría de los espacios de espinor. Sin embargo, es útil detenerse en este punto para mostrar que el formalismo ya desarrollado nos proporciona un marco eficiente para aspectos limitados, pero importantes, de la electrodinámica clásica (CED).
  • 3.2: El campo libre de Maxwell

Electrodinámica cuántica

En física de partículas, electrodinámica cuántica (QED) es la teoría relativista de campos cuánticos de la electrodinámica. En esencia, describe cómo interactúan la luz y la materia y es la primera teoría en la que se logra un acuerdo total entre la mecánica cuántica y la relatividad especial. QED describe matemáticamente todos los fenómenos que involucran partículas cargadas eléctricamente que interactúan por medio del intercambio de fotones y representa la contraparte cuántica del electromagnetismo clásico dando una explicación completa de la interacción entre la materia y la luz.

En términos técnicos, QED puede describirse como una teoría de perturbación del vacío cuántico electromagnético. Richard Feynman lo llamó "la joya de la física" por sus predicciones extremadamente precisas de cantidades como el momento magnético anómalo del electrón y el desplazamiento de Lamb de los niveles de energía del hidrógeno. [1]: Ch1


3: Álgebra y electrodinámica de Pauli - Matemáticas

Introducimos algunas fórmulas clave de la relatividad especial y las aplicamos al movimiento de una partícula puntual cargada sin espinas de masa unitaria, sujeta a la fuerza de Lorentz debido a un campo electromagnético externo.

Álgebra de Pauli

Un elemento del álgebra de Pauli consiste en un escalar complejo, digamos, y un vector complejo tridimensional, denotado, que por lo tanto tiene ocho dimensiones reales. En efecto, esta es una generalización del álgebra de cuaterniones, pero con componentes complejos en lugar de reales. En este artículo, llamamos a estos elementos & # 8220spinors. & # 8221

Un producto de dos espinores es un espino definido por

donde y son los productos punto y cruzado, respectivamente. Tenga en cuenta que esta multiplicación es asociativa, lo que implica que no necesitamos paréntesis al multiplicar tres o más espinores. Pero la multiplicación no es conmutativa (el resultado depende del orden de los factores).

Hay dos operaciones unarias (un solo argumento) importantes en los espinores: la primera se llama reflexión (denotada), que cambia el signo de la parte del vector, es decir, la segunda toma el conjugado complejo de y de cada componente de la misma es denotado. Finalmente, solo por conveniencia, denotamos la combinación de ambos, es decir, tenga en cuenta que

que son bastante fáciles de verificar.

El correspondiente Mathematica las rutinas se ven y funcionan así.

A partir de ahora, consideramos que un vector tridimensional es un caso especial de espinor, lo que significa que es una abreviatura de. Podemos calcular fácilmente varias funciones de espinores (y de vectores tridimensionales, como un caso especial). Así, por ejemplo, asumiendo que es un vector tridimensional con componentes reales, encontramos

donde es la longitud de y es un vector unitario en la misma dirección.

De manera similar, para un vector tridimensional con componentes imaginarios puros (que expresamos en la forma para mantener los elementos de real), el mismo tipo de expansión produce

de nuevo, donde es la longitud de y es un vector unitario en la misma dirección.

Esto se puede extender fácilmente a un argumento de vector complejo, como sigue.

Relatividad especial

La idea básica de la teoría de Einstein es unir el espacio y el tiempo en una sola entidad del espacio-tiempo, cuyos & # 8220puntos & # 8221 (o eventos) pueden entonces ser representados por verdadero espinores de tipo. La separación entre dos eventos cualquiera constituye un llamado 4-vector que, cuando se multiplica (en el sentido de espinor) por su propia reflexión, produce un escalar puro. Ahora se postula que esta cantidad debe ser invariante (tener el mismo valor) en todos los sistemas de coordenadas inerciales (es decir, aquellos que se diferencian entre sí por una rotación fija y / o un impulso & # 8212a movimiento a velocidad constante). Para simplificar, nuestra elección de unidades establece la velocidad de la luz (que debe ser la misma en todos los sistemas inerciales) igual a 1.

La pregunta es: ¿cómo transformamos 4 vectores de un marco inercial a otro, mientras mantenemos esta invariancia? La respuesta es proporcionada por

donde y representan un 4-vector en el antiguo y nuevo marco de referencia, respectivamente, y es un espinor tal que. Es obvio que sigue siendo real siempre que es real, y que

donde (el invariante escalar de). Esto demuestra que tiene el mismo valor en todos los marcos de referencia inerciales. Requerir que la reflexión sea una operación independiente del marco (lo que significa que para cada 4 vectores) conduce a

A partir de esto, podemos ver que se transforma de manera diferente a, siendo un ejemplo de una estructura de cuatro dimensiones. Covector (un -vector, en nuestra notación). Otro ejemplo importante de un vector-es el operador, donde representa el gradiente tridimensional (espacial) habitual (la colección de, y derivadas parciales).

Se puede demostrar que si y solo si, dónde hay un vector & # 8220pure & # 8221 (es decir, tridimensional, pero con un valor potencialmente complejo). Esta es una forma completamente general, pero bastante inconveniente, de que, afortunadamente, se puede probar que cualquiera de ellos puede expresarse como un producto de una rotación tridimensional ordinaria y un impulso, donde y son vectores de valor real. Para ver que da como resultado una rotación ordinaria de la parte del vector de (donde la magnitud de especifica el ángulo y la dirección de define el eje de rotación), considere

donde es la descomposición de en componentes paralelos y perpendiculares a, respectivamente. Tenga en cuenta que conmuta con (y cualquier función del mismo) en consecuencia, permanece sin cambios por esta transformación. Por otro lado, y anticonmutar (es decir), lo que implica

y, en consecuencia, el resto de (8). Se puede ver entonces que esta transformación deja intacta la parte escalar de un 4-vector, y rota la parte vectorial usando y como eje y ángulo de rotación (del marco antiguo, con respecto al nuevo), respectivamente.

Aquí, se puede reemplazar por, donde y representan la dirección unitaria y la magnitud de un vector tridimensional (una velocidad del marco antiguo con respecto al nuevo), respectivamente. Esto conduce al siguiente resultado simplificado (y físicamente más significativo) de tal impulso, aplicado a:

Campos electromagnéticos

Un campo de 4 vectores de importancia central es el potencial electromagnético, donde y cada componente de son funciones de valor real de una ubicación del espacio-tiempo (es decir, de,, y). Ahora viene un punto importante: dentro del marco actual, no tiene sentido físicamente multiplicar dos 4 vectores (no sabríamos cómo transformar tal producto de un marco inercial a otro), pero es posible multiplicar un -vector por un 4-vector, creando lo que llamamos un vector mixto. Por tanto, es bastante legítimo hacer

creando un vector mixto, que tiene su propia nueva forma de transformación (que se muestra a continuación).

Para interpretar físicamente el lado derecho de (12), primero imponemos la llamada condición de Lorenz (a menudo atribuida erróneamente al Lorentz más famoso) de (demostramos en breve que esta condición es invariante en el marco), y nos identificamos con, dónde y son los campos eléctricos y magnéticos resultantes (valores reales), respectivamente.

Ahora se puede mostrar con bastante facilidad que simplemente rotará los dos campos. Por otro lado, un impulso da como resultado

ya que la transformación de un vector mixto se realiza mediante. En ambos casos (rotación y refuerzo), la parte escalar permanece igual a cero, lo que demuestra la invariancia de la condición de Lorenz.

A diferencia de los 4 vectores, los vectores mixtos se pueden multiplicar, dando como resultado un nuevo vector mixto (en términos de sus propiedades de transformación). Así, por ejemplo,

nos dice que ambos y son campos escalares invariantes.

De manera similar, multiplicar un vector de 4 por un vector mixto devuelve un vector de 4, por ejemplo,

Esta vez, el resultado debe ser igual a la densidad de carga / corriente (otro 4-vector básico más de la teoría), esto da como resultado una formulación compacta de álgebra de Dirac de las ecuaciones habituales de Maxwell. Como ejemplo, el siguiente programa calcula el campo electromagnético de una partícula masiva puntual de una unidad de carga, moviéndose a una velocidad uniforme a lo largo del eje y también verifica que el resultado satisfaga las ecuaciones de Maxwell.

Dinámica de una partícula cargada puntual

Elegimos unidades en las que tanto la masa en reposo como la carga de la partícula son iguales a 1. Se denota su ubicación instantánea, donde los tres componentes de son funciones de. Para hacer que el marco de las ecuaciones subsiguientes sea independiente (que tenga la misma forma en todos los marcos inerciales), ahora necesitamos introducir la partícula y el llamado tiempo adecuado por

Ya sabemos que las transformadas como un 4-vector, por lo tanto, son relativísticamente invariantes (el punto encima implica diferenciación con respecto a). El tiempo adecuado se calcula entonces mediante la integral correspondiente, a saber

que, al ser una & # 8220sum & # 8221 de cantidades invariantes, también es un escalar invariante. Esto implica que

se transforma como un 4-vector (lo llamamos el 4-momento de la partícula en movimiento).

El movimiento de la partícula cargada en un campo electromagnético dado ahora se puede establecer resolviendo

donde el lado derecho es la llamada fuerza de Lorentz, y & # 8220 & # 8221 toma la parte real de su argumento (también un 4-vector). Tenga en cuenta que & # 8220 & # 8221 aplicado a un vector 4 sigue siendo un vector 4 (ya que el conjugado complejo de un vector 4 se transforma en un vector 4, como se puede verificar fácilmente).

Basado en (18), el lado derecho de (19) es igual a

Para una partícula con una carga unitaria negativa, el signo de este 4-vector estaría invertido.

Una forma de resolver la ecuación de 4 vectores resultante es expandir el lado izquierdo de (19):

que tiene que ser igual a (20). Cancelando el factor escalar de, obtenemos

Finalmente, la primera (parte escalar) de estas cuatro ecuaciones se puede obtener tomando el producto escalar de las tres ecuaciones restantes (la parte vectorial) y, por lo tanto, es redundante. Todo lo que necesitamos resolver al final es

o, de manera equivalente (resolviendo para),

cuya exactitud se puede verificar fácilmente sustituyéndolo en el lado izquierdo de (23) y obteniendo el lado derecho. En general, estas ecuaciones solo pueden resolverse numéricamente. El resultado será una función de tres componentes de un tiempo dependiente del marco (el tiempo adecuado se usó solo como una herramienta intermedia para asegurar la concordancia entre los marcos de referencia inerciales, nuestra solución permanece correcta en cualquier otro marco, después de la transformación correspondiente). El siguiente programa encuentra el movimiento de una partícula cargada negativamente (elegida porque una fuerza atractiva hace que la trayectoria resultante sea de alguna manera más interesante, en comparación con la repulsión con la misma carga) en el campo de la sección anterior.

La partícula de masa unitaria originalmente estacionaria ha sido & # 8220capturada & # 8221 por la partícula masiva en movimiento (que se supone que es tan pesada que su propio movimiento no se ve afectado), y continuará orbitando (mientras sigue su movimiento uniforme). Es importante darse cuenta de que esta formulación del problema ha ignorado el hecho de que una partícula en movimiento genera (e irradia) un campo electromagnético propio, que modificaría aún más su movimiento. Más importante aún, también sabemos que, a nivel atómico, el mundo está gobernado por la mecánica cuántica, lo que en última instancia da como resultado una descripción totalmente diferente de una partícula en órbita. Ésta es la razón por la que la última solución es solo de interés matemático. Bajo una amplia gama de condiciones iniciales, la partícula ligera se sentiría atraída para colisionar con la pesada.

Movimiento en un campo electromagnético constante

Las cosas se vuelven más fáciles cuando ambos son campos constantes (en el espacio y en el tiempo). A continuación, se puede expresar como, donde es el valor inicial de la partícula & # 8217s 4-momento, y es un espinor análogo a que (en lugar de transformar 4 vectores entre marcos inerciales) avanza a su ubicación actual. Esta vez nos resulta más conveniente hacer ambas funciones y del tiempo adecuado. Además, no se debe olvidar cumplir la condición, que luego se mantiene automáticamente en todo momento futuro.

Expandiendo el lado derecho de (19) rendimientos

Esto debería ser igual al lado izquierdo de (19), a saber

teniendo la solución obvia

una función de un vector mixto se transforma como un vector mixto. Después de calcular y, en consecuencia, todo lo que tenemos que hacer es integrar esta última expresión en términos de obtener una solución para. A continuación se muestra un ejemplo sencillo.

En este ejemplo, hemos podido obtener una solución analítica explícita.


La descripción más común del campo electromagnético utiliza dos campos vectoriales tridimensionales llamados campo eléctrico y campo magnético. Cada uno de estos campos vectoriales tiene un valor definido en cada punto del espacio y el tiempo y, por lo tanto, a menudo se consideran funciones de las coordenadas espaciales y temporales. Como tal, a menudo se escriben como mi(X, y, z, t) (campo eléctrico) y B(X, y, z, t) (campo magnético).

Si solo el campo eléctrico (mi) no es cero y es constante en el tiempo, se dice que el campo es un campo electrostático. Del mismo modo, si solo el campo magnético (B) no es cero y es constante en el tiempo, se dice que el campo es un campo magnetostático. Sin embargo, si el campo eléctrico o magnético tiene una dependencia del tiempo, ambos campos deben considerarse juntos como un campo electromagnético acoplado utilizando las ecuaciones de Maxwell.

Ecuaciones de Maxwell en el enfoque de campo vectorial Editar

El comportamiento de los campos eléctricos y magnéticos, ya sea en casos de electrostática, magnetostática o electrodinámica (campos electromagnéticos), se rige por las ecuaciones de Maxwell:

Ecuaciones de Maxwell (campos vectoriales)
∇ ⋅ E = ρ ε 0 < Displaystyle nabla cdot mathbf = < frac < rho> < varepsilon _ <0> >>> Ley de Gauss
∇ ⋅ B = 0 < Displaystyle nabla cdot mathbf =0> Ley de Gauss para el magnetismo
∇ × E = - ∂ B ∂ t < Displaystyle nabla times mathbf = - < frac < parcial mathbf > < t parcial >>> Ley de Faraday
∇ × B = μ 0 J + μ 0 ε 0 ∂ E ∂ t < Displaystyle nabla times mathbf = mu _ <0> mathbf + mu _ <0> varepsilon _ <0> < frac < parcial mathbf > < t parcial >>> Ley de Ampère-Maxwell

donde ρ es la densidad de carga, que puede (y a menudo lo hace) depender del tiempo y la posición, ε0 es la constante eléctrica, μ0 es la constante magnética, y J es la corriente por unidad de área, también una función del tiempo y la posición. Las ecuaciones toman esta forma con el Sistema Internacional de Cantidades.

Cuando se trata solo de materiales lineales isotrópicos no dispersivos, las ecuaciones de Maxwell a menudo se modifican para ignorar las cargas ligadas reemplazando la permeabilidad y permitividad del espacio libre con la permeabilidad y permitividad del material lineal en cuestión. Para algunos materiales que tienen respuestas más complejas a los campos electromagnéticos, estas propiedades pueden ser representadas por tensores, con dependencia del tiempo relacionada con la capacidad del material para responder a cambios rápidos de campo (dispersión (óptica), relaciones Green-Kubo) y posiblemente también dependencias de campo que representan respuestas de materiales no lineales y / o no locales a campos de gran amplitud (óptica no lineal).

Muchas veces en el uso y cálculo de campos eléctricos y magnéticos, el enfoque utilizado primero calcula un potencial asociado: el potencial eléctrico, φ, para el campo eléctrico y el potencial del vector magnético, A, para el campo magnético. El potencial eléctrico es un campo escalar, mientras que el potencial magnético es un campo vectorial. Esta es la razón por la que a veces el potencial eléctrico se llama potencial escalar y el potencial magnético se llama potencial vectorial. Estos potenciales se pueden utilizar para encontrar sus campos asociados de la siguiente manera:

Ecuaciones de Maxwell en formulación potencial Editar

Estas relaciones pueden sustituirse en las ecuaciones de Maxwell para expresar estas últimas en términos de potenciales. La ley de Faraday y la ley de Gauss para el magnetismo se reducen a identidades (por ejemplo, en el caso de la Ley de Gauss para el magnetismo, 0 = 0). Las otras dos ecuaciones de Maxwell resultan menos simples.

Estas ecuaciones tomadas en conjunto son tan poderosas y completas como las ecuaciones de Maxwell. Además, el problema se ha reducido algo, ya que los campos eléctrico y magnético juntos tenían seis componentes que resolver. [1] En la formulación del potencial, solo hay cuatro componentes: el potencial eléctrico y los tres componentes del potencial vectorial. Sin embargo, las ecuaciones son más complicadas que las ecuaciones de Maxwell que utilizan campos eléctricos y magnéticos.

Libertad de calibre Editar

Estas ecuaciones se pueden simplificar aprovechando el hecho de que los campos eléctricos y magnéticos son cantidades físicamente significativas que pueden medirse, pero los potenciales no lo son. Existe la libertad de restringir la forma de los potenciales siempre que esto no afecte a los campos eléctricos y magnéticos resultantes, denominada libertad de calibre. Específicamente para estas ecuaciones, para cualquier elección de una función escalar de posición y tiempo dos veces diferenciable λ, Si (φ, A) es una solución para un sistema dado, entonces también lo es otro potencial (φ′, A') dada por:

Esta libertad se puede utilizar para simplificar la formulación potencial. Normalmente se elige cualquiera de estas dos funciones escalares: el indicador de Coulomb y el indicador de Lorenz.

Calibre de culombio Editar

Esta elección de función da como resultado la siguiente formulación de las ecuaciones de Maxwell:

Varias características de las ecuaciones de Maxwell en el medidor de Coulomb son las siguientes. En primer lugar, resolver el potencial eléctrico es muy fácil, ya que la ecuación es una versión de la ecuación de Poisson. En segundo lugar, resolver el potencial del vector magnético es particularmente difícil. Ésta es la gran desventaja de este medidor. La tercera cosa a tener en cuenta, y algo que no es inmediatamente obvio, es que el potencial eléctrico cambia instantáneamente en todas partes en respuesta a un cambio en las condiciones en una localidad.

Por ejemplo, si una carga se mueve en Nueva York a la 1 pm hora local, entonces un observador hipotético en Australia que pudiera medir el potencial eléctrico directamente mediría un cambio en el potencial a la 1 pm hora de Nueva York. Esto aparentemente viola la causalidad en la relatividad especial, es decir, la imposibilidad de información, señales o cualquier cosa que viaje más rápido que la velocidad de la luz. La solución a este aparente problema radica en el hecho de que, como se dijo anteriormente, ningún observador puede medir los potenciales que miden los campos eléctricos y magnéticos. Entonces, la combinación de φ y ∂A/∂t utilizado para determinar el campo eléctrico restaura el límite de velocidad impuesto por la relatividad especial para el campo eléctrico, haciendo que todas las cantidades observables sean consistentes con la relatividad.

Condición del calibre de Lorenz Editar

Un calibre que se utiliza a menudo es la condición de calibre de Lorenz. En esto, la función escalar λ se elige de tal manera que

significa que λ debe satisfacer la ecuación

El medidor de Lorenz da como resultado la siguiente forma de ecuaciones de Maxwell:

El operador ◻ 2 < displaystyle Box ^ <2>> se llama d'Alembertian (algunos autores lo indican solo con el cuadrado ◻ < displaystyle Box>). Estas ecuaciones son versiones no homogéneas de la ecuación de onda, y los términos del lado derecho de la ecuación sirven como funciones fuente de la onda. Al igual que con cualquier ecuación de onda, estas ecuaciones conducen a dos tipos de solución: potenciales avanzados (que están relacionados con la configuración de las fuentes en puntos futuros en el tiempo) y potenciales retardados (que están relacionados con las configuraciones pasadas de las fuentes). los primeros generalmente se ignoran cuando se analiza el campo desde una perspectiva de causalidad.

Como se señaló anteriormente, el indicador de Lorenz no es más válido que cualquier otro indicador, ya que los potenciales no se pueden medir directamente, sin embargo, el indicador de Lorenz tiene la ventaja de que las ecuaciones son invariantes de Lorenz.

Extensión a la electrodinámica cuántica Editar

La cuantificación canónica de los campos electromagnéticos procede elevando los potenciales escalares y vectoriales. φ(X), A(X), desde campos hasta operadores de campo. Sustituyendo 1 /C 2 = ε0μ0 en las ecuaciones de calibre de Lorenz anteriores da:

Aquí, J y ρ son la corriente y la densidad de carga del campo de materia. Si el campo de materia se toma para describir la interacción de los campos electromagnéticos con el electrón de Dirac dado por el campo de espinor de Dirac de cuatro componentes ψ, las densidades de corriente y carga tienen la forma: [2]

donde α son las tres primeras matrices de Dirac. Usando esto, podemos reescribir las ecuaciones de Maxwell como:

que es la forma utilizada en electrodinámica cuántica.

De manera análoga a la formulación tensorial, se introducen dos objetos, uno para el campo y otro para la corriente. En álgebra geométrica (GA) estos son multivectores. El campo multivector, conocido como vector de Riemann-Silberstein, es

y el multivector actual es

Las ecuaciones de Maxwell se reducen a una sola ecuación [3]

En tres dimensiones, el derivado tiene una estructura especial que permite la introducción de un producto cruzado:

por lo que se ve fácilmente que la ley de Gauss es la parte escalar, la ley de Ampère-Maxwell es la parte vectorial, la ley de Faraday es la parte pseudovectora y la ley de Gauss para el magnetismo es la parte pseudoescalar de la ecuación. Después de expandir y reorganizar, esto se puede escribir como

El Riemann-Silberstein se convierte en bivector

y la carga y la densidad de corriente se convierten en un vector

Las ecuaciones de Maxwell se reducen a una sola ecuación

Editar formulario de campo 2

En el espacio libre, donde ε = ε0 y μ = μ0 son constantes en todas partes, las ecuaciones de Maxwell se simplifican considerablemente una vez que se utiliza el lenguaje de la geometría diferencial y las formas diferenciales. En lo que sigue, se utilizan unidades cgs-gaussianas, no unidades SI. (Para convertir a SI, vea aquí.) Los campos eléctrico y magnético ahora se describen conjuntamente mediante una forma de 2 F en una variedad de espacio-tiempo de 4 dimensiones. El tensor de Faraday F μ ν < displaystyle F _ < mu nu >> (tensor electromagnético) se puede escribir como una forma 2 en el espacio de Minkowski con la firma métrica (- + + +) como

Las ecuaciones de fuente libre se pueden escribir mediante la acción de la derivada exterior en esta forma 2. Pero para las ecuaciones con términos fuente (ley de Gauss y ecuación de Ampère-Maxwell), se necesita el dual de Hodge de esta forma 2. El operador estrella de Hodge toma un pag-forma a un ( nortepag ) -form, donde norte es el número de dimensiones. Aquí, toma la forma 2 (F) y da otra forma de 2 (en cuatro dimensiones, nortepag = 4 - 2 = 2). Para los vectores cotangentes base, el dual de Hodge se da como (ver Operador de estrella de Hodge § Cuatro dimensiones)

etcétera. Usando estas relaciones, el dual de la forma 2 de Faraday es el tensor de Maxwell,

Edición actual de 3 formas, doble corriente de 1 forma

Aquí, la forma de 3 J se llama el forma de corriente eléctrica o actual de 3 formas:

con la correspondiente forma 1 dual:

Las ecuaciones de Maxwell luego se reducen a la identidad de Bianchi y la ecuación fuente, respectivamente: [4]

donde d denota la derivada exterior, un operador diferencial independiente de coordenadas y métricas naturales que actúa sobre las formas, y el operador de estrella de Hodge (dual) ⋆ < displaystyle < star >> es una transformación lineal del espacio de 2 formas a el espacio de (4 - 2) formas definidas por la métrica en el espacio de Minkowski (en cuatro dimensiones incluso por cualquier métrica conforme a esta métrica). Los campos están en unidades naturales donde 1 / 4πε0 = 1 .

Dado que d 2 = 0, la forma 3 J satisface la conservación de la corriente (ecuación de continuidad):

La forma tridimensional actual se puede integrar en una región espacio-temporal tridimensional. La interpretación física de esta integral es la carga en esa región si es similar a un espacio, o la cantidad de carga que fluye a través de una superficie en una cierta cantidad de tiempo si esa región es una superficie espacial que cruza un intervalo de tiempo. Como la derivada exterior se define en cualquier variedad, la versión de forma diferencial de la identidad de Bianchi tiene sentido para cualquier variedad de 4 dimensiones, mientras que la ecuación fuente se define si la variedad está orientada y tiene una métrica de Lorentz. En particular, la versión en forma diferencial de las ecuaciones de Maxwell es una formulación conveniente e intuitiva de las ecuaciones de Maxwell en relatividad general.

Influencia macroscópica lineal de la materia Editar

En una teoría macroscópica lineal, la influencia de la materia en el campo electromagnético se describe a través de una transformación lineal más general en el espacio de 2 formas. Nosotros llamamos

la transformación constitutiva. El papel de esta transformación es comparable a la transformación de dualidad de Hodge. Las ecuaciones de Maxwell en presencia de materia se convierten en:

donde el actual 3-forma J todavía satisface la ecuación de continuidad dJ = 0 .

Cuando los campos se expresan como combinaciones lineales (de productos exteriores) de formas base θ pag ,

la relación constitutiva toma la forma

donde las funciones de los coeficientes de campo son antisimétricas en los índices y los coeficientes constitutivos son antisimétricos en los pares correspondientes. En particular, la transformación de dualidad de Hodge que conduce a las ecuaciones de vacío discutidas anteriormente se obtiene tomando

que hasta el escalado es el único tensor invariante de este tipo que se puede definir con la métrica.

En esta formulación, el electromagnetismo se generaliza inmediatamente a cualquier variedad orientada en 4 dimensiones o con pequeñas adaptaciones a cualquier variedad.

Firma métrica alternativa Editar

La forma 2 de la curvatura de Faraday se convierte en

y el tensor de Maxwell se convierte en

La forma actual de 3 J es

y la forma dual 1 correspondiente es

La norma actual ahora es positiva y es igual a

Formulación tradicional Editar

La materia y la energía generan la curvatura del espacio-tiempo. Este es el tema de la relatividad general. La curvatura del espacio-tiempo afecta la electrodinámica. Un campo electromagnético que tiene energía e impulso también genera curvatura en el espacio-tiempo. Las ecuaciones de Maxwell en el espacio-tiempo curvo se pueden obtener reemplazando las derivadas en las ecuaciones en el espacio-tiempo plano con derivadas covariantes. (Si esta es la generalización apropiada requiere una investigación separada). Las ecuaciones con fuente y sin fuente se convierten en (unidades cgs-gaussianas):

es un símbolo de Christoffel que caracteriza la curvatura del espacio-tiempo y ∇α es la derivada covariante.

Formulación en términos de formas diferenciales Editar

La formulación de las ecuaciones de Maxwell en términos de formas diferenciales puede usarse sin cambios en la relatividad general. La equivalencia de la formulación relativista general más tradicional que usa la derivada covariante con la formulación de forma diferencial se puede ver como sigue. Elija coordenadas locales X α que da una base de 1-formas dX α en cada punto del conjunto abierto donde se definen las coordenadas. Usando esta base y las unidades cgs-gaussianas definimos

  • El tensor de campo antisimétrico Fαβ, correspondiente al campo 2-form F
  • La forma tridimensional infinitesimal del vector actual J

El tensor épsilon contraído con la forma diferencial de 3 produce 6 veces el número de términos requeridos.

Aquí gramo es como de costumbre el determinante de la matriz que representa el tensor métrico, gramoαβ. Un pequeño cálculo que utiliza la simetría de los símbolos de Christoffel (es decir, la ausencia de torsión de la conexión Levi-Civita) y la constancia covariante del operador de estrella de Hodge muestra que en este vecindario de coordenadas tenemos:

Una forma elegante e intuitiva de formular las ecuaciones de Maxwell es utilizar haces de líneas complejas o un paquete principal U (1), sobre cuyas fibras U (1) actúa con regularidad. La conexión principal U (1) ∇ en el paquete de líneas tiene una curvatura F = ∇ 2 que es una forma de dos que satisface automáticamente dF = 0 y se puede interpretar como una intensidad de campo. Si el paquete de líneas es trivial con una conexión de referencia plana D podemos escribir ∇ = d + A y F = dA con A la forma 1 compuesta por el potencial eléctrico y el potencial del vector magnético.

En mecánica cuántica, la conexión en sí se utiliza para definir la dinámica del sistema. Esta formulación permite una descripción natural del efecto Aharonov-Bohm. En este experimento, un campo magnético estático atraviesa un cable magnético largo (por ejemplo, un cable de hierro magnetizado longitudinalmente). Fuera de este cable, la inducción magnética es cero, en contraste con el potencial vectorial, que esencialmente depende del flujo magnético a través de la sección transversal del cable y no desaparece en el exterior. Como tampoco hay campo eléctrico, el tensor de Maxwell F = 0 en toda la región del espacio-tiempo fuera del tubo, durante el experimento. Esto significa, por definición, que la conexión ∇ es plana allí.

Sin embargo, como se mencionó, la conexión depende del campo magnético a través del tubo, ya que la holonomía a lo largo de una curva no contráctil que rodea el tubo es el flujo magnético a través del tubo en las unidades adecuadas. Esto se puede detectar de forma cuántica con un experimento de difracción de electrones de doble rendija en una onda de electrones que viaja alrededor del tubo. La holonomía corresponde a un cambio de fase adicional, que conduce a un cambio en el patrón de difracción. [6] [7]

Las siguientes son las razones para usar cada una de estas formulaciones.

Formulación potencial Editar

En la mecánica clásica avanzada a menudo es útil, y en la mecánica cuántica con frecuencia es esencial, expresar las ecuaciones de Maxwell en un formulación potencial que involucra el potencial eléctrico (también llamado potencial escalar) φ, y el potencial magnético (un potencial vectorial) A. Por ejemplo, el análisis de antenas de radio hace un uso completo de los potenciales escalares y vectoriales de Maxwell para separar las variables, una técnica común utilizada para formular las soluciones de ecuaciones diferenciales. Los potenciales se pueden introducir utilizando el lema de Poincaré sobre las ecuaciones homogéneas para resolverlos de forma universal (esto supone que consideramos un espacio topológicamente simple, por ejemplo, un espacio contráctil). Los potenciales se definen como en la tabla anterior. Alternativamente, estas ecuaciones definen mi y B en términos de los potenciales eléctricos y magnéticos que luego satisfacen las ecuaciones homogéneas para mi y B como identidades. La sustitución da las ecuaciones de Maxwell no homogéneas en forma potencial.

Muchas opciones diferentes de A y φ son consistentes con los campos eléctricos y magnéticos observables dados mi y B, por lo que los potenciales parecen contener más información (clásicamente) no observable. Sin embargo, se comprende bien la no unicidad de los potenciales. Para cada función escalar de posición y tiempo λ(X, t), los potenciales se pueden cambiar mediante una transformación de calibre como

sin cambiar el campo eléctrico y magnético. Dos pares de potenciales transformados de calibre (φ, A) y (φ′, A') son llamados equivalente de calibre, y la libertad de seleccionar cualquier par de potenciales en su clase de equivalencia de calibre se denomina libertad de calibre. Nuevamente, según el lema de Poincaré (y bajo sus supuestos), la libertad de calibre es la única fuente de indeterminación, por lo que la formulación de campo es equivalente a la formulación potencial si consideramos las ecuaciones potenciales como ecuaciones para clases de equivalencia de calibre.

Las ecuaciones de potencial se pueden simplificar mediante un procedimiento llamado fijación de calibre. Dado que los potenciales solo se definen hasta la equivalencia de calibre, somos libres de imponer ecuaciones adicionales a los potenciales, siempre que para cada par de potenciales haya un par equivalente de calibre que satisfaga las ecuaciones adicionales (es decir, si las ecuaciones de fijación del calibre corte a la acción de calibre). Los potenciales de calibre fijo todavía tienen una libertad de calibre bajo todas las transformaciones de calibre que dejan invariantes las ecuaciones de fijación de calibre. La inspección de las ecuaciones potenciales sugiere dos opciones naturales. En el calibre de Coulomb, imponemos A = 0, que se usa principalmente en el caso de la magnetostática cuando podemos descuidar la C −2 ∂ 2 A/∂t 2 término. En el calibre de Lorenz (llamado así por el danés Ludvig Lorenz), imponemos

La condición de calibre de Lorenz tiene la ventaja de ser invariante de Lorentz y conducir a ecuaciones invariantes de Lorenz para los potenciales.

Enfoque manifiestamente covariante (tensor) Editar

Las ecuaciones de Maxwell son exactamente consistentes con la relatividad especial, es decir, si son válidas en un marco de referencia inercial, entonces son automáticamente válidas en cualquier otro marco de referencia inercial. De hecho, las ecuaciones de Maxwell fueron cruciales en el desarrollo histórico de la relatividad especial. Sin embargo, en la formulación habitual de las ecuaciones de Maxwell, su coherencia con la relatividad especial no es obvia, solo puede probarse mediante un laborioso cálculo.

Por ejemplo, considere un conductor que se mueve en el campo de un imán. [8] En el marco del imán, ese conductor experimenta un magnético fuerza. Pero en el marco de un conductor que se mueve en relación con el imán, el conductor experimenta una fuerza debido a un eléctrico campo. El movimiento es exactamente consistente en estos dos marcos de referencia diferentes, pero matemáticamente surge de formas muy diferentes.

Por esta y otras razones, a menudo es útil reescribir las ecuaciones de Maxwell de una manera que sea "manifiestamente covariante", es decir. obviamente coherente con la relatividad especial, incluso con sólo un vistazo a las ecuaciones, utilizando cuatro vectores y tensores covariantes y contravariantes. Esto se puede hacer usando el tensor EM F, o el 4-potencial A, con la 4-corriente J - ver formulación covariante del electromagnetismo clásico.

Enfoque de formas diferenciales Editar

La ley de Gauss para el magnetismo y la ley de Faraday-Maxwell se pueden agrupar ya que las ecuaciones son homogéneas y se consideran geométricas. identidades expresando el campo F (una forma 2), que puede derivarse de la 4 potenciales A. La ley de Gauss para la electricidad y la ley de Ampere-Maxwell podrían verse como la ecuaciones dinámicas de movimiento de los campos, obtenido mediante el principio lagrangiano de mínima acción, del "término de interacción" AJ (introducido a través de derivados covariantes de gauge), acoplando el campo a la materia. Para la formulación de campo de las ecuaciones de Maxwell en términos de un principio de acción extrema, consulte el tensor electromagnético.

A menudo, la derivada del tiempo en la ecuación de Faraday-Maxwell motiva llamar a esta ecuación "dinámica", lo cual es algo engañoso en el sentido del análisis anterior. Esto es más bien un artefacto de romper la covarianza relativista eligiendo una dirección temporal preferida. Para tener grados físicos de libertad propagados por estas ecuaciones de campo, se debe incluir un término cinético FF por A, y tenga en cuenta los grados de libertad no físicos que pueden eliminarse mediante la transformación de calibre AA - dα . Consulte también la fijación de indicadores y los fantasmas de Faddeev-Popov.

Enfoque de cálculo geométrico Editar

Esta formulación utiliza el álgebra que genera el espacio-tiempo mediante la introducción de un producto distributivo, asociativo (pero no conmutativo) llamado producto geométrico. Los elementos y operaciones del álgebra generalmente se pueden asociar con el significado geométrico. Los miembros del álgebra pueden descomponerse por grado (como en el formalismo de formas diferenciales) y el producto (geométrico) de un vector con un k-vector se descompone en un (k - 1) -vector y un (k + 1) -vector. El (k - 1) -componente de vector se puede identificar con el producto interno y el (k + 1) -componente del vector con el producto exterior. Es de conveniencia algebraica que el producto geométrico sea invertible, mientras que los productos interno y externo no lo son. Las derivadas que aparecen en las ecuaciones de Maxwell son vectores y los campos electromagnéticos están representados por el bivector de Faraday F. Esta formulación es tan general como la de las formas diferenciales para variedades con un tensor métrico, ya que estas se identifican naturalmente con r-formas y hay operaciones correspondientes. Las ecuaciones de Maxwell se reducen a una ecuación en este formalismo. Esta ecuación se puede dividir en partes como se hizo anteriormente por razones comparativas.


Contenido

La teoría de campo más antigua que tenía una simetría de gauge fue la formulación de Maxwell, en 1864-1865, de la electrodinámica ("Una teoría dinámica del campo electromagnético") que afirmaba que cualquier campo vectorial cuyo rizo desaparece y, por lo tanto, normalmente se puede escribir como un gradiente de una función: podría agregarse al potencial vectorial sin afectar el campo magnético. La importancia de esta simetría pasó desapercibida en las primeras formulaciones. De manera igualmente inadvertida, Hilbert había derivado las ecuaciones de campo de Einstein postulando la invariancia de la acción bajo una transformación de coordenadas general. Más tarde, Hermann Weyl, en un intento de unificar la relatividad general y el electromagnetismo, conjeturó que Eichinvarianz o la invariancia bajo el cambio de escala (o "calibre") también podría ser una simetría local de la relatividad general. Después del desarrollo de la mecánica cuántica, Weyl, Vladimir Fock y Fritz London modificaron el calibre reemplazando el factor de escala con una cantidad compleja y convirtieron la transformación de escala en un cambio de fase, que es una simetría de calibre U (1). Esto explicó el efecto del campo electromagnético en la función de onda de una partícula de mecánica cuántica cargada. Esta fue la primera teoría de gauge ampliamente reconocida, popularizada por Pauli en 1941. [1]

En 1954, tratando de resolver parte de la gran confusión en la física de partículas elementales, Chen Ning Yang y Robert Mills introdujeron teorías de gauge no abelianas como modelos para comprender la fuerte interacción que mantiene unidos los nucleones en los núcleos atómicos. [2] (Ronald Shaw, trabajando con Abdus Salam, introdujo de forma independiente la misma noción en su tesis doctoral.) Generalizando la invariancia de calibre del electromagnetismo, intentaron construir una teoría basada en la acción del SU (no abeliano) (2 ) grupo de simetría en el doblete isospin de protones y neutrones. Esto es similar a la acción del grupo U (1) sobre los campos espinosos de la electrodinámica cuántica. En física de partículas, el énfasis estaba en el uso de teorías de gauge cuantificadas.

Esta idea encontró más tarde aplicación en la teoría cuántica de campos de la fuerza débil, y su unificación con el electromagnetismo en la teoría electrodébil. Las teorías de gauge se volvieron aún más atractivas cuando se descubrió que las teorías de gauge no abelianas reproducían una característica llamada libertad asintótica. Se creía que la libertad asintótica era una característica importante de las interacciones fuertes. Esto motivó la búsqueda de una teoría sólida sobre el medidor de fuerza. Esta teoría, ahora conocida como cromodinámica cuántica, es una teoría de gauge con la acción del grupo SU (3) sobre el triplete de colores de los quarks. El modelo estándar unifica la descripción del electromagnetismo, interacciones débiles e interacciones fuertes en el lenguaje de la teoría de gauge.

En la década de 1970, Michael Atiyah comenzó a estudiar las matemáticas de las soluciones a las ecuaciones clásicas de Yang-Mills. En 1983, el estudiante de Atiyah, Simon Donaldson, se basó en este trabajo para mostrar que la clasificación diferenciable de 4 variedades suaves es muy diferente de su clasificación hasta el homeomorfismo. [3] Michael Freedman utilizó el trabajo de Donaldson para exhibir exóticos R 4 s, es decir, estructuras diferenciables exóticas en el espacio euclidiano de 4 dimensiones. Esto llevó a un interés creciente en la teoría de gauge por sí misma, independientemente de sus éxitos en física fundamental. En 1994, Edward Witten y Nathan Seiberg inventaron técnicas de la teoría del calibre basadas en la supersimetría que permitieron el cálculo de ciertos invariantes topológicos [4] [5] (los invariantes de Seiberg-Witten). Estas contribuciones a las matemáticas de la teoría del calibre han llevado a un renovado interés en esta área.

La importancia de las teorías de gauge en física se ejemplifica en el tremendo éxito del formalismo matemático al proporcionar un marco unificado para describir las teorías de campo cuántico del electromagnetismo, la fuerza débil y la fuerza fuerte. Esta teoría, conocida como Modelo Estándar, describe con precisión las predicciones experimentales con respecto a tres de las cuatro fuerzas fundamentales de la naturaleza, y es una teoría de calibre con el grupo de calibre SU (3) × SU (2) × U (1). Las teorías modernas como la teoría de cuerdas, así como la relatividad general, son, de una forma u otra, teorías de calibre.

Ver Pickering [6] para más información sobre la historia de las teorías de campo gauge y cuántico.

Simetrías globales y locales Editar

Simetría global Editar

En física, la descripción matemática de cualquier situación física generalmente contiene grados de libertad excesivos; la misma situación física está igualmente bien descrita por muchas configuraciones matemáticas equivalentes. Por ejemplo, en la dinámica newtoniana, si dos configuraciones están relacionadas por una transformación galileana (un cambio inercial del marco de referencia), representan la misma situación física. Estas transformaciones forman un grupo de "simetrías" de la teoría, y una situación física corresponde no a una configuración matemática individual sino a una clase de configuraciones relacionadas entre sí por este grupo de simetría.

Esta idea puede generalizarse para incluir simetrías tanto locales como globales, análogas a "cambios de coordenadas" mucho más abstractos en una situación en la que no existe un sistema de coordenadas "inercial" preferido que cubra todo el sistema físico. Una teoría de gauge es un modelo matemático que tiene simetrías de este tipo, junto con un conjunto de técnicas para hacer predicciones físicas consistentes con las simetrías del modelo.

Ejemplo de simetría global Editar

Cuando una cantidad que aparece en la configuración matemática no es solo un número, sino que tiene algún significado geométrico, como una velocidad o un eje de rotación, su representación como números dispuestos en un vector o matriz también se cambia mediante una transformación de coordenadas. Por ejemplo, si una descripción de un patrón de flujo de fluido establece que la velocidad del fluido en la vecindad de (X=1, y= 0) es 1 m / s positivo X dirección, luego una descripción de la misma situación en la que el sistema de coordenadas se ha girado 90 grados en el sentido de las agujas del reloj indica que la velocidad del fluido en la vecindad de (X=0, y= 1) es 1 m / s positivo y dirección. La transformación de coordenadas ha afectado tanto al sistema de coordenadas utilizado para identificar el localización de la medición y la base en la que se valor es expresado. Siempre que esta transformación se realice globalmente (afectando la base de coordenadas de la misma manera en cada punto), el efecto sobre los valores que representan la tasa de cambio de alguna cantidad a lo largo de algún camino en el espacio y el tiempo a medida que pasa por el punto PAG es el mismo que el efecto sobre los valores que son verdaderamente locales para PAG.

Simetría local Editar

Uso de haces de fibras para describir simetrías locales Editar

Para describir adecuadamente situaciones físicas en teorías más complejas, a menudo es necesario introducir una "base de coordenadas" para algunos de los objetos de la teoría que no tienen esta relación simple con las coordenadas utilizadas para etiquetar puntos en el espacio y el tiempo. (En términos matemáticos, la teoría involucra un haz de fibras en el que la fibra en cada punto del espacio base consta de posibles bases de coordenadas para usar al describir los valores de los objetos en ese punto). Para deletrear una configuración matemática, uno debe elegir una base de coordenadas particular en cada punto (un sección local del haz de fibras) y expresar los valores de los objetos de la teoría (normalmente "campos" en el sentido del físico) utilizando esta base. Dos de tales configuraciones matemáticas son equivalentes (describen la misma situación física) si están relacionadas por una transformación de esta base de coordenadas abstracta (un cambio de sección local, o transformación de calibre).

En la mayoría de las teorías de gauge, el conjunto de posibles transformaciones de la base de gauge abstracta en un punto individual en el espacio y el tiempo es un grupo de Lie de dimensión finita. El grupo más simple de este tipo es U (1), que aparece en la formulación moderna de la electrodinámica cuántica (QED) mediante el uso de números complejos. La QED se considera generalmente como la primera y más simple teoría del calibre físico. El conjunto de posibles transformaciones de gauge de la configuración completa de una teoría de gauge determinada también forma un grupo, el grupo de medidores de la teoría. Un elemento del grupo de calibre se puede parametrizar mediante una función que varía suavemente desde los puntos del espacio-tiempo hasta el grupo de Lie (de dimensión finita), de modo que el valor de la función y sus derivadas en cada punto representa la acción de la transformación del calibre en la fibra sobre ese punto.

Una transformación de indicador con parámetro constante en cada punto en el espacio y el tiempo es análoga a una rotación rígida del sistema de coordenadas geométricas; representa una simetría global de la representación del indicador. Como en el caso de una rotación rígida, esta transformación de calibre afecta las expresiones que representan la tasa de cambio a lo largo de una trayectoria de alguna cantidad dependiente de calibre de la misma manera que las que representan una cantidad verdaderamente local. Una transformación de calibre cuyo parámetro es no una función constante se conoce como simetría local. Su efecto en las expresiones que involucran una derivada es cualitativamente diferente al de las expresiones que no lo hacen. (Esto es análogo a un cambio no inercial del marco de referencia, que puede producir un efecto Coriolis).

Campos de calibre Editar

La versión "covariante de calibre" de una teoría de calibre explica este efecto al introducir un campo de calibre (en lenguaje matemático, una conexión de Ehresmann) y formular todas las tasas de cambio en términos de la derivada covariante con respecto a esta conexión. El campo de calibre se convierte en una parte esencial de la descripción de una configuración matemática. Una configuración en la que el campo de calibre puede eliminarse mediante una transformación de calibre tiene la propiedad de que su intensidad de campo (en lenguaje matemático, su curvatura) es cero en cualquier lugar donde se encuentre una teoría de calibre. no limitado a estas configuraciones. En otras palabras, la característica distintiva de una teoría de calibre es que el campo de calibre no solo compensa una mala elección del sistema de coordenadas; por lo general, no hay una transformación de calibre que haga que el campo de calibre desaparezca.

Al analizar la dinámica de una teoría de gauge, el campo de gauge debe tratarse como una variable dinámica, similar a otros objetos en la descripción de una situación física. Además de su interacción con otros objetos a través de la derivada covariante, el campo de calibre normalmente aporta energía en forma de un término de "energía propia". Se pueden obtener las ecuaciones para la teoría de gauge mediante:

  • a partir de un ansatz ingenuo sin el campo de calibre (en el que las derivadas aparecen en una forma "desnuda")
  • enumerar aquellas simetrías globales de la teoría que pueden caracterizarse por un parámetro continuo (generalmente un equivalente abstracto de un ángulo de rotación)
  • calcular los términos de corrección que resultan de permitir que el parámetro de simetría varíe de un lugar a otro y
  • reinterpretando estos términos de corrección como acoplamientos a uno o más campos de calibre, y dando a estos campos términos de autoenergía apropiados y comportamiento dinámico.

Este es el sentido en el que una teoría gauge "extiende" una simetría global a una simetría local, y se parece mucho al desarrollo histórico de la teoría gauge de la gravedad conocida como relatividad general.

Experimentos físicos Editar

Las teorías de calibre utilizadas para modelar los resultados de los experimentos físicos se involucran en:

  • limitando el universo de configuraciones posibles a aquellas consistentes con la información utilizada para configurar el experimento, y luego
  • calcular la distribución de probabilidad de los posibles resultados que el experimento está diseñado para medir.

No podemos expresar las descripciones matemáticas de la "información de configuración" y los "posibles resultados de medición", o las "condiciones de contorno" del experimento, sin hacer referencia a un sistema de coordenadas en particular, incluida la elección del calibre. Se supone un experimento adecuado aislado de la influencia "externa" que es en sí mismo un enunciado dependiente del calibre. El mal manejo de los cálculos de dependencia del medidor en condiciones de contorno es una fuente frecuente de anomalías, y los enfoques para evitar anomalías clasifican las teorías del medidor [ aclaración necesaria ] .

Teorías del continuo Editar

Las dos teorías de gauge mencionadas anteriormente, la electrodinámica del continuo y la relatividad general, son teorías de campo continuo. Las técnicas de cálculo en una teoría del continuo suponen implícitamente que:

  • dada una elección completamente fija de calibre, las condiciones de contorno de una configuración individual se describen completamente
  • dado un calibre completamente fijo y un conjunto completo de condiciones de contorno, la mínima acción determina una configuración matemática única y, por lo tanto, una situación física única consistente con estos límites
  • La fijación del medidor no introduce anomalías en el cálculo, ya sea debido a la dependencia del medidor al describir información parcial sobre las condiciones de contorno o al carácter incompleto de la teoría.

La determinación de la probabilidad de posibles resultados de medición se realiza mediante:

  • Establecer una distribución de probabilidad sobre todas las situaciones físicas determinadas por condiciones de contorno coherentes con la información de configuración.
  • establecer una distribución de probabilidad de los resultados de la medición para cada posible situación física estas dos distribuciones de probabilidad para obtener una distribución de los posibles resultados de la medición consistente con la información de configuración

Estas suposiciones tienen suficiente validez en una amplia gama de escalas de energía y condiciones experimentales para permitir que estas teorías hagan predicciones precisas sobre casi todos los fenómenos encontrados en la vida diaria: luz, calor y electricidad, eclipses, vuelos espaciales, etc. Solo fallan en las escalas más pequeñas y más grandes debido a omisiones en las teorías mismas, y cuando las técnicas matemáticas se rompen, sobre todo en el caso de turbulencias y otros fenómenos caóticos.

Teorías cuánticas de campos editar

Aparte de estas teorías clásicas de campo continuo, las teorías de gauge más conocidas son las teorías de campo cuántico, incluida la electrodinámica cuántica y el modelo estándar de física de partículas elementales. El punto de partida de una teoría cuántica de campos es muy parecido al de su análogo continuo: una integral de acción covariante de calibre que caracteriza situaciones físicas "permisibles" de acuerdo con el principio de acción mínima. Sin embargo, las teorías continuas y cuánticas difieren significativamente en cómo manejan los grados de libertad en exceso representados por las transformaciones de gauge. Las teorías continuas, y la mayoría de los tratamientos pedagógicos de las teorías de campo cuántico más simples, utilizan una prescripción de fijación de calibre para reducir la órbita de configuraciones matemáticas que representan una situación física dada a una órbita más pequeña relacionada con un grupo de calibre más pequeño (el grupo de simetría global, o quizás incluso el grupo trivial).

Las teorías de campo cuántico más sofisticadas, en particular aquellas que involucran a un grupo de gauge no abeliano, rompen la simetría de gauge dentro de las técnicas de la teoría de perturbación al introducir campos adicionales (los fantasmas de Faddeev-Popov) y contraterminos motivados por la cancelación de anomalías, en un enfoque conocido como cuantificación BRST. Si bien estas preocupaciones son en cierto sentido muy técnicas, también están estrechamente relacionadas con la naturaleza de la medición, los límites del conocimiento de una situación física y las interacciones entre condiciones experimentales incompletamente especificadas y teoría física incompleta entendida. [ cita necesaria ] Las técnicas matemáticas que se han desarrollado para hacer manejables las teorías de gauge han encontrado muchas otras aplicaciones, desde la física del estado sólido y la cristalografía hasta la topología de baja dimensión.

Electromagnetismo clásico Editar

Las transformaciones generales del indicador ahora se convierten no solo en V ↦ V + C < displaystyle V mapsto V + C> sino

donde F es cualquier función diferenciable dos veces de forma continua que depende de la posición y el tiempo. Los campos siguen siendo los mismos bajo la transformación de calibre y, por lo tanto, las ecuaciones de Maxwell aún se cumplen. Es decir, las ecuaciones de Maxwell tienen una simetría de calibre.

Un ejemplo: Scalar O (norte) teoría del calibre Editar

A continuación se ilustra cómo la invariancia de calibre local se puede "motivar" heurísticamente a partir de las propiedades de simetría global, y cómo conduce a una interacción entre campos que originalmente no interactúan.

Considere un conjunto de norte Campos escalares reales que no interactúan, con masas iguales metro. Este sistema se describe mediante una acción que es la suma de la acción (habitual) para cada campo escalar φ i < displaystyle varphi _>

El lagrangiano (densidad) se puede escribir de forma compacta como

introduciendo un vector de campos

Ahora es transparente que el lagrangiano es invariante bajo la transformación

Esto caracteriza al global simetría de este lagrangiano en particular, y el grupo de simetría a menudo se llama el grupo de medidores el término matemático es grupo de estructura, especialmente en la teoría de estructuras G. Por cierto, el teorema de Noether implica que la invariancia bajo este grupo de transformaciones conduce a la conservación de la corrientes

donde el T a las matrices son generadoras del SO (norte) grupo. Hay una corriente conservada para cada generador.

Ahora, exigiendo que este lagrangiano haya local O (norte) -invarianza requiere que el GRAMO Las matrices (que eran constantes anteriores) deberían poder convertirse en funciones de las coordenadas del espacio-tiempo. X.

En este caso, el GRAMO las matrices no "atraviesan" las derivadas, cuando GRAMO = GRAMO(X),

El hecho de que la derivada no conmute con "G" introduce un término adicional (de acuerdo con la regla del producto), que estropea la invariancia del lagrangiano. Para rectificar esto, definimos un nuevo operador de derivada tal que la derivada de Φ < displaystyle Phi> nuevamente se transforme de manera idéntica con Φ

Esta nueva "derivada" se denomina derivada covariante (de calibre) y toma la forma

Donde gramo Se llama constante de acoplamiento una cantidad que define la fuerza de una interacción. Después de un simple cálculo podemos ver que el campo de calibre A(X) debe transformarse de la siguiente manera

El campo de calibre es un elemento del álgebra de Lie y, por lo tanto, se puede expandir como

Por tanto, hay tantos campos de gauge como generadores del álgebra de Lie.

Finalmente, ahora tenemos un invariante de calibre local Lagrangiano

La diferencia entre este lagrangiano y el original invariante de calibre global Lagrangiano es visto como el interacción lagrangiana

Este término introduce interacciones entre los norte campos escalares como consecuencia de la demanda de invariancia de calibre local. Sin embargo, para que esta interacción sea física y no completamente arbitraria, el mediador A(X) necesita propagarse en el espacio. Eso se trata en la siguiente sección agregando otro término, L g f < displaystyle < mathcal > _ < mathrm >>, al lagrangiano. En la versión cuantificada de la teoría de campo clásica obtenida, los cuantos del campo de calibre A(X) se denominan bosones gauge. La interpretación de la interacción lagrangiana en la teoría cuántica de campos es de bosones escalares que interactúan mediante el intercambio de estos bosones gauge.

El lagrangiano de Yang-Mills para el campo de calibre Editar

y la f a b c < displaystyle f ^> son las constantes de estructura del álgebra de Lie de los generadores del grupo gauge. Esta formulación del lagrangiano se llama Acción de Yang-Mills. También existen otras acciones invariantes de calibre (por ejemplo, electrodinámica no lineal, acción de Born-Infeld, modelo de Chern-Simons, término theta, etc.).

El lagrangiano completo para la teoría del calibre es ahora

Un ejemplo: Electrodinámica Editar

Como una simple aplicación del formalismo desarrollado en las secciones anteriores, consideremos el caso de la electrodinámica, con solo el campo de electrones. La acción básica que genera la ecuación de Dirac del campo de electrones es

La simetría global de este sistema es

El grupo de calibre aquí es U (1), solo rotaciones del ángulo de fase del campo, con la rotación particular determinada por la constante θ .

"Localizar" esta simetría implica el reemplazo de θ por θ(X). Una derivada covariante apropiada es entonces

Identificar el "cargo" mi (que no debe confundirse con la constante matemática e en la descripción de la simetría) con la carga eléctrica habitual (este es el origen del uso del término en las teorías gauge) y el campo gauge A(X) con el potencial de cuatro vectores del campo electromagnético da como resultado una interacción Lagrangiana

donde J μ (x) = mi ℏ ψ ¯ (x) γ μ ψ (x) < displaystyle J ^ < mu> (x) = < frac < hbar >> < bar < psi >> (x) gamma ^ < mu> psi (x)> es el cuatro vector de corriente eléctrica en el campo de Dirac. Por lo tanto, se considera que el principio de calibre introduce naturalmente el llamado acoplamiento mínimo del campo electromagnético al campo de electrones.

Añadiendo un lagrangiano para el campo de calibre A μ (x) < displaystyle A _ < mu> (x)> en términos del tensor de intensidad de campo exactamente como en electrodinámica, se obtiene el lagrangiano utilizado como punto de partida en electrodinámica cuántica.

Las teorías de los calibres generalmente se discuten en el lenguaje de la geometría diferencial. Matemáticamente, un calibre es solo una elección de una sección (local) de algún paquete principal. A transformación de calibre es solo una transformación entre dos de esas secciones.

Aunque la teoría de gauge está dominada por el estudio de conexiones (principalmente porque la estudian principalmente físicos de alta energía), la idea de una conexión no es fundamental para la teoría de gauge en general. De hecho, un resultado en la teoría del calibre general muestra que las representaciones afines (es decir, módulos afines) de las transformaciones del calibre se pueden clasificar como secciones de un haz de chorros que satisfacen ciertas propiedades. Hay representaciones que se transforman covariantemente puntuales (llamadas por los físicos transformaciones de calibre del primer tipo), representaciones que se transforman como una forma de conexión (llamadas por los físicos transformaciones de calibre del segundo tipo, una representación afín) y otras representaciones más generales, como el campo B en la teoría BF. Hay representaciones (realizaciones) no lineales más generales, pero son extremadamente complicadas. Aún así, los modelos sigma no lineales se transforman de manera no lineal, por lo que existen aplicaciones.

Si hay un paquete principal PAG cuyo espacio base es el espacio o el espacio-tiempo y el grupo de estructura es un grupo de Lie, entonces las secciones de PAG forman un espacio homogéneo principal del grupo de transformaciones de gauge.

Las conexiones (conexión de calibre) definen este paquete principal, produciendo una derivada covariante ∇ en cada paquete de vectores asociado. Si se elige un marco local (una base local de secciones), entonces esta derivada covariante está representada por la forma de conexión A, una forma 1 valorada en álgebra de Lie, que se llama calibrar el potencial en física. Evidentemente, esta no es una cantidad intrínseca, sino que depende del marco. La forma de curvatura F, una forma 2 valorada en álgebra de Lie que es una cantidad intrínseca, se construye a partir de una forma de conexión por

Las transformaciones de gauge infinitesimales forman un álgebra de Lie, que se caracteriza por un escalar suave valorado en álgebra de Lie, ε. Bajo una transformación de calibre tan infinitesimal,

No todas las transformaciones de calibre se pueden generar mediante transformaciones de calibre infinitesimales en general. Un ejemplo es cuando la variedad base es una variedad compacta sin límite, de modo que la clase de mapeos de homotopía de esa variedad al grupo de Lie no es trivial. Vea instanton para ver un ejemplo.

El Acción de Yang-Mills ahora está dado por

donde * representa el dual de Hodge y la integral se define como en geometría diferencial.

Una cantidad que es invariante de calibre (es decir, invariante bajo transformaciones de calibre) es el bucle de Wilson, que se define sobre cualquier camino cerrado, γ, de la siguiente manera:

El formalismo de la teoría de gauge se traslada a un escenario general. Por ejemplo, es suficiente pedir que un conjunto de vectores tenga una conexión métrica cuando uno lo hace, uno encuentra que la conexión métrica satisface las ecuaciones de movimiento de Yang-Mills.

Las teorías de calibre pueden cuantificarse mediante la especialización de métodos que son aplicables a cualquier teoría cuántica de campos. Sin embargo, debido a las sutilezas impuestas por las restricciones de calibre (ver la sección sobre formalismo matemático, más arriba), hay muchos problemas técnicos por resolver que no surgen en otras teorías de campo. Al mismo tiempo, la estructura más rica de las teorías de gauge permite la simplificación de algunos cálculos: por ejemplo, las identidades de Ward conectan diferentes constantes de renormalización.

Métodos y objetivos Editar

La primera teoría de gauge cuantificada fue la electrodinámica cuántica (QED). Los primeros métodos desarrollados para esto involucraron la fijación de calibres y luego la aplicación de cuantificación canónica. El método Gupta-Bleuler también se desarrolló para manejar este problema. Las teorías de gauge no abelianas ahora se manejan por una variedad de medios. Los métodos de cuantificación se tratan en el artículo sobre cuantificación.

El punto principal de la cuantificación es poder calcular amplitudes cuánticas para varios procesos permitidos por la teoría. Técnicamente, se reducen a los cálculos de ciertas funciones de correlación en el estado de vacío. Esto implica una renormalización de la teoría.

Cuando el acoplamiento continuo de la teoría es lo suficientemente pequeño, todas las cantidades requeridas pueden calcularse en la teoría de la perturbación. Los esquemas de cuantificación destinados a simplificar dichos cálculos (como la cuantificación canónica) pueden denominarse esquemas de cuantificación perturbativos. En la actualidad, algunos de estos métodos conducen a las pruebas experimentales más precisas de las teorías de gauge.

Sin embargo, en la mayoría de las teorías de calibre, hay muchas preguntas interesantes que no son perturbadoras. Los esquemas de cuantificación adecuados para estos problemas (como la teoría del calibre de celosía) pueden denominarse esquemas de cuantificación no perturbativos. Los cálculos precisos en tales esquemas a menudo requieren supercomputación y, por lo tanto, están menos desarrollados actualmente que otros esquemas.

Anomalías Editar

Se ve entonces que algunas de las simetrías de la teoría clásica no sostienen en la teoría cuántica un fenómeno llamado anomalía. Entre los más conocidos se encuentran:


Propiedades algebraicas

Las tres matrices de Pauli se pueden compactar en una sola expresión:

donde I = & # 8730 −1 es la unidad imaginaria, y δab es el delta de Kronecker, que es igual a +1 si a = B y 0 en caso contrario. Esta expresión es útil para "seleccionar" cualquiera de las matrices numéricamente sustituyendo valores de a = 1, 2, 3, a su vez útil cuando cualquiera de las matrices (pero ninguna en particular) se va a utilizar en manipulaciones algebraicas.

Los determinantes y trazas de las matrices de Pauli son:

De lo cual, podemos deducir que los valores propios de cada σI son ± 1.

Con la inclusión de la matriz de identidad, I (a veces denotado σ0 ), las matrices de Pauli forman una base ortogonal (en el sentido de Hilbert-Schmidt) del espacio real de Hilbert de matrices hermitianas complejas de 2 × 2, />, y el espacio de Hilbert complejo de todas las matrices de 2 × 2, />.

Autovectores y autovalores

Cada una de las matrices de Pauli (hermitianas) tiene dos valores propios, +1 y -1. Usando una convención en la que antes de la normalización, el 1 se coloca en las posiciones superior e inferior de las funciones de onda + y - respectivamente, los vectores propios normalizados correspondientes son:

Una ventaja de usar esta convención es que las funciones de onda + y - pueden estar relacionadas entre sí, usando las propias matrices de Pauli, por , y .

Vector de Pauli

El vector de Pauli está definido por

y proporciona un mecanismo de mapeo desde una base de vector a una base de matriz de Pauli de la siguiente manera,

sus valores propios son , y además (ver completitud, a continuación)

Sus autovectores (no normalizados) son

Relaciones de conmutación

Las matrices de Pauli obedecen a las siguientes relaciones de conmutación:

donde la estructura es constante εa B C es el símbolo de Levi-Civita, se utiliza la notación de suma de Einstein, δab es el delta de Kronecker, y I es la matriz identidad 2 × 2.

Relación con el producto puntual y cruzado

Los vectores de Pauli mapean elegantemente estas relaciones de conmutación y anticonmutación con los correspondientes productos vectoriales. Agregar el conmutador al anticonmutador da

Si se identifica con el pseudoescalar entonces el lado derecho se convierte en que es también la definición del producto de dos vectores en álgebra geométrica.

Algunas trazas de relaciones

Las siguientes trazas se pueden derivar utilizando las relaciones de conmutación y anticonmutación.

Exponencial de un vector de Pauli

uno tiene, incluso para los poderes,

que se puede mostrar primero para el caso usando las relaciones anticonmutación. Por conveniencia, el caso se toma para ser por convención.

Para poderes extraños,

.

En la última línea, la primera suma es el coseno, mientras que la segunda suma es el seno, por lo que, finalmente,

,

mientras que el determinante de la exponencial en sí es solo 1, lo que lo convierte en el elemento de grupo genérico de SU (2).

Una versión más abstracta de la fórmula. (2) para una matriz general de 2 × 2 se puede encontrar en el artículo sobre matrices exponenciales. Una versión general de (2) para un analítico (en a y & # 8722a) la función se proporciona mediante la aplicación de la fórmula de Sylvester,

que se puede reescribir en términos de índices matriciales como donde la suma está implícita sobre los índices repetidos γ y δ. Dado que esto es cierto para cualquier elección de la matriz METRO, la relación de completitud sigue como se indicó anteriormente.

Como se señaló anteriormente, es común denotar la matriz de unidades 2 & # 215 2 por σ0, asi que σ 0 αβ = δαβ. La relación de completitud puede expresarse alternativamente como

, la matriz de densidad idempotente

con valor propio 1, así que como un operador de proyección para él.

Relación con el operador de permutación

Dejar PAGij ser la transposición (también conocida como permutación) entre dos giros σI y σj viviendo en el espacio del producto tensorial ℂ 2 & # 8855 ℂ 2,

Este operador también se puede escribir de manera más explícita como el operador de intercambio de giro de Dirac,

Por tanto, sus valores propios son 1 o -1. Por lo tanto, se puede utilizar como un término de interacción en un hamiltoniano, dividiendo los valores propios de energía de sus estados propios simétricos versus antisimétricos.

El grupo SU (2) es el grupo de Lie de matrices unitarias de 2 × 2 con determinante unitario su álgebra de Lie es el conjunto de todas las matrices antihermitianas de 2 × 2 con traza 0. El cálculo directo, como el anterior, muestra que el álgebra de Lie es el álgebra real tridimensional abarcada por el conjunto <j >. En notación compacta,

Como resultado, cada j puede verse como un generador infinitesimal de SU (2). Los elementos de SU (2) son exponenciales de combinaciones lineales de estos tres generadores y se multiplican como se indicó anteriormente al discutir el vector de Pauli. Aunque esto es suficiente para generar SU (2), no es una representación adecuada de su (2), ya que los valores propios de Pauli se escalan de manera no convencional. La normalización convencional es λ = & # 160 1 2, de modo que

Como SU (2) es un grupo compacto, su descomposición de Cartan es trivial.

El álgebra de mentira su(2) es isomorfo al álgebra de Lie asi que(3), que corresponde al grupo de Lie SO (3), el grupo de rotaciones en el espacio tridimensional. En otras palabras, se puede decir que el j son una realización (y, de hecho, la realización de la dimensión más baja) de infinitesimal rotaciones en el espacio tridimensional. Sin embargo, aunque su(2) y asi que(3) son isomorfos como álgebras de Lie, SU (2) y SO (3) no son isomorfos como grupos de Lie. SU (2) es en realidad una doble cobertura de SO (3), lo que significa que hay un homomorfismo de grupo de dos a uno de SU (2) a SO (3), consulte la relación entre SO (3) y SU (2) .

Cuaterniones

El tramo lineal real de <I, 1, 2, 3> es isomorfo al álgebra real de cuaterniones ℍ. El isomorfismo de ℍ a este conjunto viene dado por el siguiente mapa (observe los signos invertidos para las matrices de Pauli):

Alternativamente, el isomorfismo se puede lograr mediante un mapa utilizando las matrices de Pauli en orden inverso,

Como el conjunto de versores U ⊂ ℍ forma un grupo isomorfo a SU (2), U da otra forma de describir SU (2). El homomorfismo de dos a uno de SU (2) a SO (3) se puede dar en términos de las matrices de Pauli en esta formulación.

Los cuaterniones forman un álgebra de división (cada elemento distinto de cero tiene una inversa) mientras que las matrices de Pauli no.


1 respuesta 1

Lo que ha escrito como una matriz explícita de 4x4, se puede escribir en la notación más compacta & quotsigma & quot como $ x_0 sigma_0 + boldsymbol < sigma> cdot mathbf. $ No es apropiado describir este multivector como un cuaternión, ni como una rotación. Los cuaterniones se pueden representar en el álgebra de Pauli como multivectores con componentes escalares + bivectores, como $ x_0 sigma_0 + i boldsymbol < sigma> cdot mathbf. $ (recuerde que $ i sigma_0 = sigma_1 sigma_2 sigma_3 $ es el pseudoescalar en la representación de Pauli, y que un producto pseudoescalar y vectorial es un bivector). En particular, estableciendo $ mathbf = sigma_2 sigma_3, mathbf = sigma_1 sigma_3, mathbf = sigma_1 sigma_2 $, es fácil ver que se puede recuperar la tabla de multiplicar de cuaterniones habitual.

En cuanto a las rotaciones en el álgebra de Pauli, la rotación de un vector alrededor de un $ mathbf normal $ se puede lograr intercalando el vector entre dos rotores conjugados, exponenciales con argumentos bivector $ sigma cdot mathbf rightarrow e ^ <-i boldsymbol < sigma> cdot mathbf/ 2> sigma cdot mathbf e ^ cdot mathbf/ 2> $ Esto funciona como una rotación desde $ e ^ <-i boldsymbol < sigma> cdot mathbf/ 2> $ conmuta con cualquier componente de $ sigma cdot mathbf $ que se encuentra en la dirección normal, y el conjugado conmuta con cualquier componente que se encuentre en el plano de la rotación (es decir, el plano representado por el bivector $ i mathbf$.) Por ejemplo, si $ sigma cdot mathbf = sigma cdot mathbf_ paralelo + sigma cdot mathbf_ perp $, donde $ mathbf_ paralelo cdot mathbf = 0 $, entonces tenemos $ begin sigma cdot mathbf & amp rightarrow e ^ <-i boldsymbol < sigma> cdot mathbf/ 2> izquierda (< sigma cdot mathbf_ paralelo + sigma cdot mathbf_ perp> right) e ^ cdot mathbf/ 2> & amp = left (< sigma cdot mathbf_ paralelo> derecha) e ^ cdot mathbf > + sigma cdot mathbf_perpiaño$ El componente que es perpendicular al plano de rotación se deja intacto, mientras que tenemos una rotación de estilo exponencial complejo de cualquier componente del vector que se encuentra en el plano. Por ejemplo, con $ i mathbf = i theta sigma_3 = sigma_1 sigma_2 $, tenemos una rotación en el plano x-y. Cada uno de los rotores es un multivector con componentes escalares + bivectores $ e ^ < theta sigma_1 sigma_2 / 2> = sigma_0 cos theta / 2 + sigma_1 sigma_2 sin theta / 2. $

Entonces, si un escalar + vector no es una rotación, ni un cuaternión, ¿qué es? No tengo una buena respuesta para eso en general, pero hay algunos casos especiales interesantes de multivectores de este tipo. Uno es el proyector, un ejemplo del cual es $ P = frac <1> <<2>> left (< sigma_0 + sigma_3> right). $ Esto se cuadra a sí mismo y se come cualquier factor de $ sigma_3 $ $ begin P ^ 2 & amp = frac <1> <<4>> left (< sigma_0 + sigma_3> right) left (< sigma_0 + sigma_3> right) & amp = frac <1> <<4>> left (< sigma_0 + 2 sigma_3 + sigma_3 ^ 2> right) & amp = frac <1> <<4>> left (<2 sigma_0 + 2 sigma_3> right) & amp = P, end$ y $ P sigma_3 = frac <1> <<2>> left (< sigma_0 + sigma_3> right) sigma_3 = frac <1> <<2>> left (< sigma_3 + sigma_3 ^ 2> right) = P. $ Los proyectores de esta forma se muestran como factores en soluciones (ondas electromagnéticas multivectoriales) de la ecuación de Maxwell en las regiones libres de carga y corriente.

En cuanto a la parte restante de su pregunta, ¿qué es un vector pseudoescalar +? En la notación sigma, dicha suma tiene la forma $ i sigma_0 alpha + boldsymbol < sigma> cdot mathbf. $ En lugar de responder a la pregunta & quot; qué es & quot;, haré trampa y daré un ejemplo en el que vemos tal suma. En particular, en la rotación anterior, teníamos productos como $ boldsymbol < sigma> cdot mathbf e ^ cdot mathbf/ 2> $. Sea $ mathbf = theta hat < mathbf> $, por lo que este producto se expande a $ boldsymbol < sigma> cdot mathbf left (< cos theta / 2 + i boldsymbol < sigma> cdot hat < mathbf> sin theta / 2> right). $ El coeficiente multivector del seno es $ i ( boldsymbol < sigma> cdot mathbf) ( boldsymbol < sigma> cdot hat < mathbf>) $. Si $ mathbf $ y $ hat < mathbf> $ son perpendiculares, tal producto es un vector, y si son paralelos, tal producto es un pseudoescalar. Sin embargo, en general, dicho producto es la suma de un vector y un pseudoescalar. Da la casualidad de que todos los productos pseudoescalares que ocurren en la expansión de la rotación, se cancelan al final, dejando solo un vector.

Otro ejemplo (aunque algo artificial), de un vector + suma pseudoescalar, se puede encontrar al considerar la generalización de la ecuación de Maxwell encontrada en la teoría de la antena de ingeniería que incluye fuentes magnéticas ficticias. Se puede construir un campo de potencial multivector que incluya tanto un potencial vectorial como un potencial escalar magnético, así: $ A = c boldsymbol < sigma> cdot mathbf - eta i phi_m sigma_0. $ Este potencial tiene ambos componentes vectoriales y pseudoescalares, pero en general también tendrían componentes escalares y bivectores.


Conjugación con matrices de Pauli

donde $ | 0 rangle = begin1 0 end$ y $ | 1 rangle = begin0 1 endPS Ahora desarrollando la primera parte de la igualdad propuesta utilizando las relaciones anteriores:

comenzar comenzar frac <1> <4> sum_^ 3 sigma_jA sigma_j & amp = frac <1> <4> ( sigma_0A sigma_0 + sigma_1A sigma_1 + sigma_2A sigma_2 + sigma_3A sigma_3) & amp = frac <1> <4> [(| 0 rangle langle0 | + | 1 rangle langle1 |) A | (0 rangle langle0 | + | 1 rangle langle1 |) + (| 0 rangle langle1 | + | 1 rangle langle0 |) A (| 0 rangle langle1 | + | 1 rangle langle0 |) & amp + i ^ 2 (| 1 rangle langle0 | - | 0 rangle langle1 |) A (| 1 rangle langle0 | - | 0 rangle langle1 |) + (| 0 rangle langle0 | - | 1 rangle langle1 |) A (| 0 rangle langle0 | - | 1 rangle langle1 |)] & amp = frac <1> <4> [| 0 rangle langle0 | A | 0 rangle langle0 | + | 0 rangle langle0 | A | 1 rangle langle1 | + | 1 rangle langle1 | A | 0 rangle langle0 | + | 1 rangle langle1 | A | 1 rangle langle1 | & amp + | 0 rangle langle1 | A | 0 rangle langle1 | + | 0 rangle langle1 | A | 1 rangle langle0 | + | 1 rangle langle0 | A | 0 rangle langle1 | + | 1 rangle langle0 | A | 1 rangle langle0 | & amp - (| 1 rangle langle0 | A | 1 rangle langle0 | + | 1 rangle langle0 | A | 0 rangle langle1 | + | 0 rangle langle1 | A | 1 rangle langle0 | + | 0 rangle langle1 | A | 0 rangle langle1 |) & amp + | 0 rangle langle0 | A | 0 rangle langle0 | - | 0 rangle langle0 | A | 1 rangle langle1 | - | 1 rangle langle1 | A | 0 rangle langle0 | + | 1 rangle langle1 | A | 1 rangle langle1 |] & amp = frac <1> <4> [ 2 | 0 rangle langle0 | A | 0 rangle langle0 | +2 | 1 rangle langle1 | A | 1 rangle langle1 | +2 | 0 rangle langle1 | A | 1 rangle langle0 | +2 | 1 rangle langle0 | A | 0 rangle langle1 |] & amp = frac <1> <2> [| 0 rangle langle0 | A | 0 rangle langle0 | + | 1 rangle langle1 | A | 1 rangle langle1 | + | 0 rangle langle1 | A | 1 rangle langle0 | + | 1 rangle langle0 | A | 0 rangle langle1 |]. fin fin

En este punto, el efecto de la multiplicación de esas matrices por la matriz $ A = begina & amp b c & amp d end$ tiene que ser analizado:

  • $ | 0 rangle langle0 | A | 0 rangle langle0 | = begin1 & amp 0 0 & amp 0 endcomenzara & amp b c & amp d endcomenzar1 & amp 0 0 & amp 0 end= comenzara & amp 0 0 & amp 0 end$.
  • $ | 1 rangle langle1 | A | 1 rangle langle1 | = begin0 y amp 0 0 y amp 1 endcomenzara & amp b c & amp d endcomenzar0 y amp 0 0 y amp 1 end= comenzar0 y amp 0 0 y amp d end$.
  • $ | 0 rangle langle1 | A | 1 rangle langle0 | = begin0 y amp 1 0 y amp 0 endcomenzara & amp b c & amp d endcomenzar0 y amp 0 1 y amp 0 end= comenzard & amp 0 0 & amp 0 end$.
  • $ | 1 rangle langle0 | A | 0 rangle langle1 | = begin0 y amp 0 1 y amp 0 endcomenzara & amp b c & amp d endcomenzar0 y amp 1 0 y amp 0 end= comenzar0 & amp 0 0 & amp a end$.

Y entonces, usando tales relaciones y el hecho de que $ tr (A) = a + d $, continuamos la derivación comenzada arriba desde el último paso

comenzar comenzar frac <1> <4> sum_^ 3 sigma_jA sigma_j & amp = frac <1> <2> [| 0 rangle langle0 | A | 0 rangle langle0 | + | 1 rangle langle1 | A | 1 rangle langle1 | + | 0 rangle langle1 | A | 1 rangle langle0 | + | 1 rangle langle0 | A | 0 rangle langle1 |] & amp = frac <1> <2> left [ begina & amp 0 0 & amp 0 end + comenzar0 & amp 0 0 & amp d end + comenzard & amp 0 0 & amp 0 end + comenzar0 & amp 0 0 & amp a end right] = frac <1> <2> begina + d & amp 0 0 & amp a + d end & amp = frac<2> begin1 y amp 0 0 y amp 1 end= frac<2> I. fin fin

Tenga en cuenta que en la derivación de la igualdad, no se ha utilizado la restricción de que $ A $ debe ser definida positiva, por lo que la igualdad es válida para todas las matrices $ 2 times 2 $.


Riassunto

Si estende al caso di un numero qualunque di particelle simili (spin 1/2) nel sistema di due particelle, la derivazione di una ownertà delle equazioni di campo non lineari di una nuova teoria dell'elettrodinamica quantistica, che indica tutte le conseguenze del principio di esclusione di Pauli per un tale sistema. Il risultato segue esattamente da un procedimento non lineare e sviluppato puramente sulla teoria di campo, applyto alla descrizione del sistema dinorte particelle, e basato sui due postulati fondamentali chea) richiedono l’invarianza rispetto alle apropiado transformazioni del gruppo non omogeneo di Lorentz, eB) che si prenda comeentà elementare l’interazione fra particelle anzichè i campi liberi delle particelle. Si estende il risultato ottenuto a limite non relativistico di particelle non interagenti in cui si dimostra che il campo di interazione della teoria si riduce alla funzione d'onda antisimmetrica per il sistema dinorte particelle della teoria di Schrödinger.


Álgebra geométrica en mecánica cuántica

Prefacio. Estos artículos analizan la teoría de Dirac de la mecánica cuántica del electrón con respecto a su estructura geométrica, como lo revela la reformulación en términos del álgebra del espacio-tiempo. El resultado principal es que la función de onda de Dirac psi se puede descomponer en la forma de operador invariante

mientras que la unidad imaginaria en la ecuación de Dirac es necesariamente identificado con el espín del electrón. Este sorprendente resultado se derivó primero [1] de una formulación en el libro STA, que, dicho sea de paso, ya mostraba que los escalares imaginarios son superfluos en la teoría de Dirac. En [3] y en un apéndice de [2] se dan derivaciones alternativas más directamente relacionadas con la formulación de matriz estándar. El método empleado en [2] deja claramente en claro que las denominadas "identidades de Fierz para covariantes bilineales" son consecuencias triviales de la forma invariante anterior para la función de onda. El artículo [2] proporciona una formulación y un análisis compactos y completos de las leyes de conservación locales en la teoría de Dirac de una partícula. Las derivaciones comparables por métodos estándar de matriz y tensor son casi diez veces más largas, como puede verse en el trabajo de Takabayashi al que se hace referencia en [2]. Un tratamiento análogo de las leyes de conservación locales en la teoría de Schroedinger juega un papel esencial en la interpretación bohmiana de la mecánica cuántica. El artículo [2] hace explícitas las complicaciones de extender el enfoque de Bohm a la QM relativista.

El tratamiento no relativista de las leyes de conservación locales, incluido el giro, se da en [5] y se discute más en [6]. El mensaje principal de estos artículos es que interpretaciones estándar de la mecánica cuántica (incluido el de Bohm) no tienen en cuenta la relación entre el espín y los números imaginarios que es inherente a la teoría de Dirac. Las conexiones necesarias entre las teorías de Dirac, Pauli y Schroedinger se derivan en [4], donde se señalan las inconsistencias entre las interpretaciones estándar.

El artículo [3] enfatiza el punto de que las interpretaciones comunes de las matrices de Pauli y Dirac como operadores de la mecánica cuántica son injustificadas y mal concebidas. GA deja absolutamente claro que estas matrices representan direcciones en el espacio y el espacio-tiempo, sin implicaciones de ningún tipo sobre el giro. De hecho, contrariamente a la afirmación de Dirac y a la creencia popular, el espín no se introduce en la teoría de Dirac mediante matrices gamma, sino mediante la definición de operadores de energía-momento. La formulación STA de la teoría de Dirac hace explícito este hecho. Más sobre este y otros asuntos de interpretación QM en la Sección III de Cálculo Geométrico Universal.

[1] Real Spinor Fields.

[2] Observables locales en la teoría de Dirac

[3] Observables, operadores y números complejos en la teoría de Dirac

[4] Coherencia en la formulación de las teorías de Dirac, Pauli y Schroedinger

[5] Observables locales en la teoría cuántica

[6] Spin e incertidumbre en la interpretación de la mecánica cuántica.

Abstracto: Una derivación rigurosa de la teoría de Schroedinger a partir de la teoría de Pauli (o Dirac) implica que la ecuación de Schroedinger describe un electrón en un estado propio de espín. Además, la energía cinética del estado fundamental está completamente determinada por la densidad de espín del electrón. Esto se puede explicar interpretando el espín como un momento angular orbital, que necesariamente va acompañado de una energía cinética. Por lo tanto, el espín es un momento angular de punto cero asociado con la energía de punto cero del electrón. Dado que la dispersión en el momento del electrón está determinada por la energía del punto cero, las relaciones de incertidumbre de Heisenberg para un electrón pueden interpretarse como una propiedad del movimiento de espín del electrón. La interpretación cinética del espín y la interpretación estadística de la mecánica cuántica se pueden sostener conjuntamente al considerar al electrón como una partícula puntual. De ello se deduce que los estados de electrones estacionarios son fuentes de campos eléctricos fluctuantes. Hay razones para creer que estos campos fluctuantes son responsables de la fuerza de Van der Waals y pueden identificarse con las fluctuaciones del campo de vacío electromagnético. La interpretación cinética del giro implica entonces que las fuerzas de Van der Waals dependen del giro. Estas ideas no solo son consistentes con el formalismo matemático convencional de la mecánica cuántica, sino que proporcionan una interpretación más completa y coherente de muchos detalles del formalismo que la interpretación alternativa de Copenhague. Sin embargo, presentan algunas dificultades que, si la interpretación cinética del espín es correcta, probablemente requieran alguna modificación de la electrodinámica cuántica para resolverse.

[7] Geometría de la teoría de Dirac

Abstracto: La función de onda de Dirac se representa en una forma en la que todos sus componentes tienen interpretaciones geométricas y físicas obvias. Seis componentes que componen una transformación de Lorentz que determina la velocidad del electrón son direcciones de giro. Esto proporciona la base para una conexión rigurosa entre la dinámica relativista de cuerpos rígidos y la evolución temporal de la función de onda. A la matriz de dispersión se le da una nueva forma como un operador con valor de espino en lugar de una función compleja. El enfoque revela una estructura geométrica de la matriz de dispersión y simplifica los cálculos de dispersión. Esta afirmación está respaldada por un cálculo explícito de la sección transversal diferencial y el cambio de polarización en la dispersión de Coulomb. Se discuten las implicaciones para la estructura e interpretación de la teoría cuántica relativista.

D. Hestenes, Publicado originalmente en: Un simposio sobre las matemáticas del espacio-tiempo físico, Facultad de Química, Universidad Nacional Autónoma de México, Ciudad de México, México (1981), 67-96.
D. Hestenes

[8] Misterios e intuiciones de la teoría de Dirac

Abstracto: La ecuación de Dirac tiene una estructura geométrica oculta que se manifiesta reformulándola en términos de un álgebra espaciotemporal real. Esto revela una conexión esencial entre el espín y los números complejos con profundas implicaciones para la interpretación de la mecánica cuántica. Entre otras cosas, sugiere que para lograr una interpretación completa de la mecánica cuántica, el espín debe identificarse con un zitterbewegung intrínseco.

D. Hestenes, publicado en: Annales de la Fondation Louis de Broglie, Vol. 28, 390 - 408 (2003).
D. Hestenes

[9] Zitterbewegung en Mecánica Cuántica

Abstracto: La posibilidad de que zitterbewegung abra una ventana a la subestructura de partículas en mecánica cuántica se explora mediante la construcción de un modelo de partículas con características estructurales inherentes a la ecuación de Dirac. Este artículo desarrolla un modelo dinámico autónomo del electrón como una partícula similar a la luz con zitterbewegung helicoidal e interacciones electromagnéticas. El modelo admite soluciones periódicas con energía cuantificada y el momento magnético correcto se genera por circulación de carga. Atribuye al electrón un momento dipolar eléctrico que gira con ultra alta frecuencia, y se analiza en detalle la posibilidad de observarlo directamente como una resonancia en la canalización de electrones. Se discute la correspondencia con la ecuación de Dirac. Se sugiere una modificación de la ecuación de Dirac para incorporar el momento dipolar giratorio.

D. Hestenes, publicado en: Fundamentos de la física, Vol. 40, 1-54 (2010) DOI 10.1007 / s10701-009-9360-3.
D. Hestenes


Ver el vídeo: Τύποι Vieta - Απόδειξη - Παραδείγματα Άλγεβρα Α Λυκείου (Julio 2022).


Comentarios:

  1. Gajinn

    Es notable, la pieza útil.

  2. Iver

    Creo que no tienes razón. Lo discutiremos. Escribe en PM, nos comunicaremos.

  3. Seabert

    Mensajes personales en todo el día de hoy enviar?

  4. Gamuro

    ¿Qué haríamos sin tu excelente frase?

  5. Yehudi

    Esta admirable frase tiene que ser deliberadamente



Escribe un mensaje