Algebra Lineare 1 Equazioni Lineari e Sistemi

Algebra Lineare 1 Equazioni Lineari e Sistemi

Immagine dal Museo Städel

Sistemi di equazioni lineari

Prefazione

Questo è il primo capitolo di ciò che diventerà una serie continua sui fondamenti dell’Algebra Lineare, la matematica di base dietro il machine learning. Questo articolo sarà più utile se letto insieme ad Algebra Lineare e sue applicazioni di David C. Lay, Steven R. Lay e Judi J. McDonald. Considerate questa serie come una risorsa esterna di accompagnamento.

Attraverso questi saggi, spero di consolidare la mia comprensione di questi concetti fondamentali e, se possibile, offrire ulteriore chiarezza ad altri con un approccio basato sull’intuizione per imparare la matematica. Se ci sono errori o opportunità per me di approfondire ulteriormente, condividetelo e apporterò le modifiche necessarie.

Contesto

Le equazioni lineari e i sistemi di equazioni lineari hanno una varietà di applicazioni nel mondo reale nei settori della finanza, dell’ingegneria, della chimica, dell’informatica, delle statistiche e della fisica e oltre. In chimica, le equazioni lineari sono utilizzate per bilanciare le reazioni chimiche e calcolare le quantità di reagenti e prodotti. Questo fondamento dell’Algebra Lineare appare anche in fisica, dove le equazioni lineari sono utilizzate nella cinematica e nella termodinamica per descrivere il moto degli oggetti, aiutando a calcolare distanze, velocità e accelerazioni e a modellare il trasferimento di calore e il flusso di energia nei sistemi fisici. Il campo finanziario si basa sulle equazioni lineari e sui sistemi per la pianificazione del budget e l’analisi del portafoglio, mentre gli ingegneri potrebbero utilizzare gli stessi strumenti per condurre analisi strutturali per modellare le forze e gli stress negli edifici. L’Algebra Lineare è onnipresente; tutti possono apprezzarla in qualche modo.

Equazioni lineari

Un’ equazione lineare è un’equazione con una o più variabili e per ogni variabile, l’esponente a cui è elevata la variabile deve essere uno. Può essere scritta nella forma: a₁x₁ + a₂x₂ + … + 2ᵣxᵣ = b. I valori [a₁, a₁, …, aᵣ] e b sono chiamati coefficienti di un’equazione lineare.

Esempi di equazioni lineari includono: 2x + 5y = 10, 6x = 18, 7v + 8w + 0x + 2y + 3z = 15 e 3x₁ + 4x₂ + 5x₃+9x₄ + 10x₇ = 3.

Un esempio di equazione non lineare sarebbe 2x² + 6x + 5 = 2; questo è un’istanza di un’equazione quadratica*. Un altro esempio simile potrebbe essere 7x₁ + 3x₂ = x₁* y₁; il motivo diventa evidente quando si rappresenta graficamente questa equazione, che può essere riarrangiata per formare la funzione razionale y = 7x / x – 3 che è curva anziché lineare.

Considerate l’equazione lineare 2x + 5y = 10. Il diagramma sottostante illustra la rappresentazione grafica dell’equazione lineare, noterete che è una linea. Ciò diventa più ovvio quando ricordiamo l’equazione di una retta: y = mx + b, dove m = pendenza e b = intercetta y. L’equazione lineare può essere riarrangiata come mostrato di seguito per assumere questa forma.

Si può trarre la seguente conclusione: tutti i punti (x, y) che cadono sulla retta sono quindi soluzioni dell’equazione 2x + 5y = 10. Ad esempio, supponiamo di selezionare il punto di intersezione con l’asse delle x (5, 0) e sostituire i valori di x e y nelle rispettive posizioni nell’equazione. 2(5) + 5(0) = 10. Qualsiasi punto (x, y) sulla retta può essere sostituito nell’equazione e la relazione sarà vera. Possiamo generalizzare questa scoperta in una regola:

L’insieme delle soluzioni in ℝ²* per un’equazione lineare con due variabili, ax + by = c, può essere rappresentato come una linea.

Si noti che questa singola equazione ha un numero infinito di soluzioni che spaziano su ℝ²; daremo un’occhiata più da vicino al numero di soluzioni in seguito.

Questo stesso concetto di base si trasferisce a spazi di coordinate di dimensione superiore indicati come ℝⁿ come ℝ³ in cui la linea diventa un piano a causa dell’aggiunta di una terza variabile.

Sistemi di equazioni lineari

Un sistema di equazioni lineari è una collezione di una o più equazioni lineari con le equazioni che condividono variabili simili. Un esempio:

6x + 2y = 4

2x + 4y = 8

Una soluzione a un sistema di equazioni lineari è definita dai valori (s₁, s₂, …, sᵣ) che rendono vere ciascuna equazione quando sostituiti alle rispettive variabili. Nel caso del sistema sopra, la soluzione sarebbe (0, 2), perché quando (0, 2) viene sostituito nel sistema, entrambe le equazioni risultano vere.

Soluzioni di un sistema lineare

Quali sono le implicazioni grafiche di una soluzione di un sistema lineare? Quali sono i vari casi di numero di soluzioni per un sistema lineare? Questa sezione esaminerà ciascuna delle tre possibilità in maggior dettaglio. Sono le seguenti:

  1. Soluzione unica
  2. Nessuna soluzione
  3. Infinito numero di soluzioni

Soluzione unica: Nel caso di un sistema lineare con due variabili come quello sopra, la soluzione è un punto di intersezione. Perché? La soluzione è la coppia ordinata in cui entrambe le equazioni devono essere soddisfatte, se non esiste una tale coppia ordinata, ciò significa che le linee non si incrociano mai. Questo è un esempio di soluzione unica. Esiste solo una soluzione che soddisfa tutte le equazioni del sistema lineare.

Nessuna soluzione: Considera il caso di nessuna soluzione. Cosa potrebbe implicare nel contesto di un sistema lineare con due variabili? In quali scenari una collezione di linee non si incontrerebbe mai? Un caso potrebbe essere se fossero parallele. Nel caso di un sistema lineare in cui le linee sono tutte parallele, il sistema lineare non avrà soluzioni. Un altro caso potrebbe essere se mentre alcune linee possono intersecarsi con altre, non c’è un punto di intersezione comune che tutte le linee condividono.

Infinito numero di soluzioni: L’ultimo caso per un sistema lineare è l’esistenza di un numero infinito di soluzioni. Quando potrebbe essere possibile che ci siano infinite soluzioni per un sistema lineare a due variabili? Se le linee sono uguali, allora ci sono infiniti punti di intersezione perché si sovrappongono, e quindi esistono infinite soluzioni. Considera il seguente sistema lineare:

6x + 3y = 18

2x + y = 6

Sebbene i coefficienti possano essere diversi, queste linee sono in realtà identiche! Se dividi ciascuno dei coefficienti della prima equazione per 3, l’equazione risultante sarà 2x + y = 6.

La visualizzazione del numero di soluzioni per un sistema lineare cambia man mano che aumenta il numero delle variabili. Nell’immagine sottostante sono rappresentati possibili diagrammi dei tre casi di soluzione per un sistema lineare con tre variabili. Oltre le tre dimensioni diventa difficile per il cervello umano visualizzare, ma le stesse regole si applicano! Indipendentemente dal numero di variabili, tutti i sistemi lineari hanno zero soluzioni, una soluzione o infinito numero di soluzioni.

Questo diagramma è stato adattato da src.

Notazione matriciale

Man mano che le equazioni lineari diventano più complesse, la notazione può diventare ingombrante. È importante che le informazioni di un sistema lineare siano condensate per essere facili da manipolare e lavorare, per cui spesso viene utilizzata la notazione matriciale al posto di un insieme di equazioni. Una matrice dei coefficienti è un tipo di matrice che esclude il coefficiente b da ogni equazione. Una matrice aumentata include il coefficiente b, quindi ha una colonna in più rispetto a una matrice dei coefficienti.

La dimensione, anche chiamata ordine, di una matrice ci dice quante righe e colonne ha una matrice. Una matrice m x n è una matrice con m righe e n colonne. Il numero di righe corrisponde a quante equazioni lineari ha un sistema mentre il numero di colonne ci dice quante variabili ci sono. Fate attenzione a garantire che il numero di righe preceda il numero di colonne poiché l’ordine non è interscambiabile.

Risolvere un sistema lineare

C’è un modo sistematico per determinare se un sistema lineare ha una soluzione e, in caso affermativo, se ha una soluzione unica o infinite soluzioni, e da lì ottenere le soluzioni. La risoluzione di un sistema lineare può essere eseguita utilizzando equazioni lineari nella loro forma originale o con una matrice, anche se è consigliabile utilizzare una matrice poiché la notazione è più pulita e compatta. È comunque utile essere ben familiarizzati con entrambi i metodi perché forniscono ulteriori approfondimenti sulla meccanica dell’altro.

Di seguito è riportato un processo passo passo per risolvere un sistema di equazioni senza matrice. L’idea di base è quella di creare nuove equazioni moltiplicando quelle esistenti per ottenere equazioni identiche che possono quindi essere aggiunte o sottratte da un’altra equazione per eliminare una variabile. Questo processo viene quindi ripetuto fino a quando non abbiamo eliminato abbastanza incognite dal sistema per poter risolvere una variabile e quindi lavorare per risolvere il resto attraverso la sostituzione all’indietro. Alla fine, è necessario effettuare un controllo per garantire che la soluzione soddisfi effettivamente il sistema di equazioni.

Operazioni riga

I passaggi descritti in precedenza sono trasferibili alla procedura centrata sulla matrice per risolvere un sistema lineare. Fate attenzione a come le variabili che vengono eliminate sono designate all’interno della matrice dopo ogni trasformazione. Prima di entrare in ciò però, definiamo alcune operazioni riga. Due sono in realtà parallele alle operazioni che abbiamo applicato in precedenza.

  1. Sostituzione: “sostituisci una riga con la somma di se stessa e un’altra riga”.*
  2. Scambio: “scambia due righe”.*
  3. Scala: “moltiplica tutte le voci di una riga per una costante diversa da zero”.*

Riaffrontiamo lo stesso sistema lineare ma stavolta utilizzando matrici e applicando operazioni riga.

Notate come ho utilizzato le stesse operazioni e fattori di scala come nel metodo delle equazioni lineari. Senza sorpresa, otteniamo le stesse equazioni di prima. Qualcosa altro da notare è la formazione triangolare nell’angolo in basso a sinistra della matrice finale. Ha senso che questo modello emerga perché i 0 sono indicatori di una variabile eliminata e ogni variabile eliminata ci avvicina sempre più all’identificazione di un’equazione che possiamo risolvere facilmente; ciò a sua volta fa progressi nella risoluzione del sistema nel suo insieme. Rivedremo questa occorrenza e fornirò una definizione più formale al riguardo nel prossimo capitolo.

Sommario

In questo capitolo abbiamo imparato:

  • Equazioni lineari: un’equazione con una o più variabili in cui il grado dell’equazione deve essere uguale a 1.
  • Sistemi di equazioni lineari: una raccolta di equazioni lineari.
  • Soluzioni per un sistema di una o più equazioni lineari: un sistema lineare ha zero soluzioni, una soluzione unica o infinite soluzioni.
  • Notazione matriciale: una matrice rettangolare che viene utilizzata come modo condensato per rappresentare un sistema lineare.
  • Operazioni riga: operazioni di sostituzione, scambio e scala ci consentono di trasformare una matrice in una che ha eliminato abbastanza variabili sconosciute per risolvere il sistema.
  • Risolvere un sistema lineare: un modo sistematico per trovare a) se esistono soluzioni per un dato sistema lineare e b) se esistono soluzione/i, quali sono i loro valori esatti.

Note

*Salvo diversa indicazione, tutte le immagini sono dell’autore dell’articolo.

*A proposito: la parola “quadratica” deriva da “quadratus” che è il participio passato della parola latina “quadrare” che significa “rendere quadro”; il che rende omaggio al suo grado! [src]

*ℝ² è lo spazio di tutte le possibili coppie ordinate (x, y) sulla retta dei numeri reali, ed è rappresentato da un piano bidimensionale. ℝ² comprende l’intero insieme dei numeri reali, e tale insieme è infinito in modo incalcolabile, il che significa che lo spazio ℝ² è anch’esso infinito.

*Citazione per le operazioni di riga [src]