User Tools

Site Tools


string_format_read

This is an old revision of the document!


String format read/write

Format string read napad iskorištava dinamiku funkcija s formatiranim stringovima i načina na koji se argumenti dodjeljuju tim funkcijama. Uzmimo naprimjer funkciju printf:

printf("Hello %s, nice to meet you!", username);

%s označava „placeholder” za string varijablu koji će printf ispuniti zadanim argumentom username i zatim ispisati rezultat. Interno, printf prati svaki placeholder (npr. %s, %d, %x, %p …) i očekuje da je svaki potkrijepljen dodatnim argumentom kako bi ga popunio. Npr.

  printf("%s %s\n", first_name, last_name) 

mora sadržavati 2 dodatna argumenta uz početni string (dakle first_name i last_name) kako bi ispravno radio.

Ranjivost: Ako programer definira ispis varijable uz pomoć formatirane funkcije bez da zada ispravan broj argumenta, formatirana funkcija ne može razaznati radi li se o grešci ili ne zbog čega uzima argumente registara sačuvane na stogu ispod base pointera ili sa stoga iznad base pointera (argumenti 7 itd…) kako bi popunila zadane formate. Primjer:

printf(„%p %p”);

Ispisat će se sadržaji argumenata 2 i 3 (koji zapravo ne postoje, već će se uzeti s tih pozicija u memoriji: x64 konvencija, sami format string je sadržan unutar 1. argumenta) u formatu pointera:

printf(format); //gdje je format definiran kao char *format = „%p %p”

Ekvivalent gornjem primjeru, ispisat će se sadržaj u memoriji koji bi sadržavao argumente na 2 i 3 u formatu pointera. X64 konvencija na linuxu definira da se argumenti za funkcije nalaze redom: rdi, rsi, rdx, rcx, r8, r9 zatim stog (ako je potrebno više od 6 argumenata) prije poziva. Unutar funkcije registri koji sadrže argumente pushaju se na stog nakon lokalnih varijabli. Zbog toga format string read napad omogućava napadaču da čita proizvoljan broj podataka sa stoga ako je korisniku dopušteno definiranje format stringa. Maksimalan broj argumenata koje registri mogu sadržavati jest 6. RDI (prvi registar) sadrži sami format stringa („%p.%p….”). To znači da ako se unese veći broj formata od 5, formatirana funkcija uzme 5 argumenata iz preostalih pozicija u memoriji namijenjene za argumente te ostale argumente sa stoga koji prethode base pointeru.

Kupon

Opis zadatka:

https://platforma.hacknite.hr/challenges#Kupon-115

Jakov je napravio program za rezervaciju mjesta u svom restoranu. U programu je zapisao i kupon kod za besplatnu večeru. Jakov tvrdi da je trenutno nemoguće doći do njega, ali ako uspiješ smiješ ga iskoristiti.

Spoji se na program uz pomoć naredbe telnet (ako koristiš Windows) ili naredbe netcat (ako koristiš Linux):

  telnet chal.platforma.hacknite.hr 12012
		
  netcat chal.platforma.hacknite.hr 12012

Rješenje:

Na liniji koja sadrži:

printf(input)

nalazi se ranjivost string format reada. Unutar polja kupon veličine 48 bajtova nalazi se flag. Dakle potrebno je ispisati vrijednost flag-a sa stoga uz pomoć string format reada. Zbog poretka definiranja varijabli kupon pa input, na samom stogu će na nižoj adresi biti polje kupon, a zatim polje input (ovo ponekad nije istina zbog optimizacije stoga, no u ovom slučaju poredak je sačuvan, za provjeru uvijek je moguće ručno pregledati stog uz pomoć gdb-a). To znači da će se nakon poziva nove funkcije polje kupon nalaziti na adresama iznad postavljenje return adrese te nove funkcije. Ta područja su u x64 calling konvenciji namijenjena argumentima 7 pa nadalje. Dakle, ako u polje input upišemo %p.%p.%p.%p.%p.%p.%p.%p.%p.%p.%p prvih 5 %p će ispisati memorije unutar printf funkcije namijenjene za argumente 2-6, a preostalih 6 %p će ispisati sadržaj cijelog polja kupon (jer mu je veličina 48 bajtova, a jedan pointer je veličine 8 bajtova). Nakon ispisa danih adresa od 6. pointera pa nadalje jest sadržaj polja kupon. Taj sadržaj je potrebno provući kroz hex converter u tekst i time će se dobiti sadržaj polja kupon.


Napomena 1: Zbog little endian zapisa, %p format očekuje da su na nižim adresama bajtovi manjih potencija, a sami zapis stringa je poredan od niže adrese prema višoj zbog čega je svaki bajt stringa unutar pointera ispisan obrnutim redoslijedom. Posljedično tome završetak stringa (opisan s newline \n tj. \x0a u hex formatu) “proguta” 0 u ispisu pointera. Recimo da je ispis nekog pointer 0xa414141. Provlačenjem kroz konverter konvertirale bi se vrijednosti \xa4 \x14 \x14 \x10 što nije ispravno. Potrebno je nadodati 0 na početak danog pointera kako bi se ispisale ispravne vrijednosti: \x0a \x41 \x41 \x41.

Primjer lokalnog ispisa rješenja:

Primjer - Zadatak s Hacknite platforme - Format

Formatirani stringovi su česta pojava u programima. Znate li dovoljno o njima?

Spojite se na online servis naredbom

nc chal.platforma.hacknite.hr 13018 ako koristite Linux odnosno telnet chal.platforma.hacknite.hr 13018 ako koristite Windows

Hint: uploadali smo dio exploit koda koji vam daje return adresu funkciju

Pregledom koda možemo vidjeti da funkcija main sadrži ranjive pozive funkcije printf.

printf("Primjer 1) 523\n");
fgets(buf,sizeof(buf),stdin);
printf(buf,523);
printf("Primjer 2) \"Volim formatiranje\"\n");
fgets(buf,sizeof(buf),stdin);
printf(buf,"Volim formatiranje");
printf("Primjer 3) \'c\'\n");
fgets(buf,sizeof(buf),stdin);
printf(buf,'c');

Nakon upisa unosa u buffer ispisuje se formatirana vrijednost te se postupak ponavlja tri puta.

Također, očito je da je cilj zadatka pozvati funkciju getFlag().

void getFlag(){
   int fd = open("./flag.txt",0,0);
   char buf[100];
   int r = read(fd,buf,sizeof(buf));
   write(1,buf,r);
}

Plan rješavanja zadatka je sljedeći:

1) Format string read napadom dobiti adresu koja se nalazi na stogu (engl. stack)

2) Pomoću adrese dobivene format string read napadom izračunati adresu na stogu koja pohranjuje return adresu

3) Format string write napadom zamijeniti return adresu adresom getFlag funkcije

Kako bi sastavili payload za format string read napad, koristit ćemo gdb uz GEF ekstenziju (može se koristiti i pwndbg ili neka druga ekstenzija koja poboljšava funkcionalnosti gdb-a kako bi se olakšalo pisanje exploita, ali treba pripaziti na razlike u sintaksi naredbi tih ekstenzija).

Prvo moramo postaviti breakpoint na prvi ranjivi poziv funkcije printf , a zatim pokrenuti program.

Nakon toga naredbom telescope -l 25 možemo dobiti prvih 25 vrijednosti na stogu. Cilj nam je pronaći vrijednost na stogu koja je zapravo adresa neke druge vrijednosti na stogu.

Takve vrijednosti su u ispisu naredbe telescope označene ljubičastom bojom, alternativno možemo potvrditi da je adresa unutar raspona vrijednosti stoga pomoću “vmmap” naredbe.

Vrijednosti sa stoga se mogu dohvaćati pomoću format string argumenta %p, a umjesto ponavljanja vrijednosti %p mnogo puta dok ne dobijemo željenu vrijednost, možemo koristiti sintaksu %X$P gdje je X offset argumenta na stogu kojeg želimo dohvatiti.

Prva adresa koja tome odgovara je na offsetu 20 od vrha stacka (tj. rsp-a) prikazano crvenom strelicom. Jedan offset odgovara 8 bajtova pošto je to zadana veličina argumenta %p. Međutim za dohvatiti tu adresu format string read napadom potrebno je upisati %25$p, a ne %20$p zato što se po Linux call konvenciji prvih 5 argumenata uvijek nalaze u registrima. Stoga, tek nakon 5. argumenta se vrijednost krenu uzimati s vrha stoga.

Nakon toga je potrebno kroz debugger vidjeti koliki je offset od adrese koje smo dobili do pohranjene return adrese (pohranjenu return adresu možemo vidjeti npr. naredbom telescope $rbp).

Zatim je potrebno izmijeniti return adresu kako bi se skočilo na adresu getFlag funkcije.

Funkcija printf nudi funkcionalnost pisanja pomoću %n placeholdera. Placeholder “%n” kaže printf funkciji da zapiše broj znakova koji su se ispisali u tom printf pozivu na adresu argumenta.

Primjerice poziv

printf("test%n", &val);

bi zapisao broj u varijablu val.

Primjer takvog payloada jest: “%10$n%64x%11$hn%4534x%12$hnaaaaa” + stack_ret_addr+4 + stack_ret_addr+2 + stack_ret_addr.

%n jest upis integer vrijednosti (4 bajta), a %hn shorta (2 bajta). Dijelovi payloada su sljedeći: %10$n, %64x, %11$hn, %4534x, %12$hn, aaaaa i stack_ret adrese.

Cilj jest upisati adresu getFlag funkcije, 0x00000000004011f6. Format adresa je u LSB obliku (manje vrijednosti dolaze prije). Prvo se upisuje vrijednost 0 na gornja 4 bajta s prvim dijelom payloada, %10$n. To tad printf nije imao nikakav ispis zbog čega se upisuje 0. Zatim se uz pomoć %64x ispisuju 64 razmaka. 64 u hex obliku jest 0x40. Ta vrijednost se zatim upisuje s %11$hn (%hn, dakle 2 bajta). Na kraju, ispisuje se dodatnih 4534 razmaka (plus prethodnih 64) kako bi se dobila vrijednost 0x11f6 za sveukupni broj ispisanih znakova. Ta vrijednost se upisuje s %12$hn.

Dakle, redom su upisane vrijednosti 0x00000000, 0x0040 i 0x11f6 na adrese stack_ret_addr+4, stack_ret_addr+2 i stack_ret_addr što odgovara adresi getFlag funkcije u LSB obliku. Kako bi se ispravni argumenti uzimali s vrha potrebno je napraviti ispravan alignment. U ovom primjeru, duljina stringa “%10$n%64x%11$hn%4534x%12$hnaaaaa” jest 32 bajta. Jer %n i %hn uzimaju pointere ako argumente, na samom stacku se nalaze 4 argumenta samo kroz payload. Uzimajući u obzir 5 argumenata danih kroz registre, stack_ret_addr+4 argument se nalaze točno na poziciji 10. argumenta. Zbog toga %10$n uzima 10. argument (isto vrijedi za ostale). Za to služi niz “aaaaa” na kraju stringa, on se koristi za poravnavanje. Generalno ga je lakše dodavati na kraj niza kako bi računica za broj ispisanih znakova bila jednostavnija (jer ispis tih znakova dolazi nakon upisivanja kroz %n ili %hn).

Za ručno sastavljanja payloada, najprije se odrede dijelovi adrese i poredaju rastući. Najviših 4 bajta adrese getFlag funkcije su 0, zbog čega taj dio dolazi kao prvi argument. Ovisno o payloadu, poredak se može izmijeniti. Također, dobra je praksa podijeliti vrijednosti na short umjesto int jer ispis razmaka traje kraće. Umjesto ispisivanja 0x004011f6 znakova ispiše se najprije 0x40 i zatim 0x11f6.

Jednom kada se sastavi kostur payloada (poredak argumenata, ispis razmaka s %x i upis vrijednosti kroz %hn ili %n) potrebno je igrati se s poravnanjem. Odredi se pozicija prvog argumenta koji se nalazi iza trenutačne duljine stringa, npr. ako je duljina trenutačnog stringa 34 sljedeći višekratnih broja 8 jest 40 što znači da će prvi argument biti na poziciji 11 itd…

Pwntools

Automatiziranje exploita se može postići uz pomoć pwntoolsa. Objektu FmtStr se proslijedi funkcija za slanje i primanje payloada. Zatim se zabilježi na koju adresu se želi upisati proizvoljna vrijednost i na kraju se funkcija izvrši.

Na primjeru zadatka, slanje zadnjeg posljednjeg payloada bi izgledao na sljedeći način:

      format_string = FmtStr (execute_fmt=send_payload)
      format_string.write(stack_ret_addr,0x00000000004011f6)
      format_string.execute_writes()

Uz automatizirano exploitanje, mogu se kreirati payloadi itd… Više se može pročitati ovdje.

string_format_read.1738924285.txt.gz · Last modified: 2025/12/01 11:40 (external edit)

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki