User Tools

Site Tools


string_format_read

This is an old revision of the document!


String format read/write

Format string read napad iskorištava dinamiku funkcija s formatiranim stringovima i načina na koji se argumenti dodjeljuju tim funkcijama. Uzmimo naprimjer funkciju printf:

printf("Hello %s, nice to meet you!", username);

%s označava „placeholder” za string varijablu koji će printf ispuniti zadanim argumentom username i zatim ispisati rezultat. Interno, printf prati svaki placeholder (npr. %s, %d, %x, %p …) i očekuje da je svaki potkrijepljen dodatnim argumentom kako bi ga popunio. Npr.

  printf("%s %s\n", first_name, last_name) 

mora sadržavati 2 dodatna argumenta uz početni string (dakle first_name i last_name) kako bi ispravno radio.

Ranjivost: Ako programer definira ispis varijable uz pomoć formatirane funkcije bez da zada ispravan broj argumenta, formatirana funkcija ne može razaznati radi li se o grešci ili ne zbog čega uzima argumente registara sačuvane na stogu ispod base pointera ili sa stoga iznad base pointera (argumenti 7 itd…) kako bi popunila zadane formate. Primjer:

printf(„%p %p”);

Ispisat će se sadržaji argumenata 2 i 3 (koji zapravo ne postoje, već će se uzeti s tih pozicija u memoriji: x64 konvencija, sami format string je sadržan unutar 1. argumenta) u formatu pointera:

printf(format); //gdje je format definiran kao char *format = „%p %p”

Ekvivalent gornjem primjeru, ispisat će se sadržaj u memoriji koji bi sadržavao argumente na 2 i 3 u formatu pointera. X64 konvencija na linuxu definira da se argumenti za funkcije nalaze redom: rdi, rsi, rdx, rcx, r8, r9 zatim stog (ako je potrebno više od 6 argumenata) prije poziva. Unutar funkcije registri koji sadrže argumente pushaju se na stog nakon lokalnih varijabli. Zbog toga format string read napad omogućava napadaču da čita proizvoljan broj podataka sa stoga ako je korisniku dopušteno definiranje format stringa. Maksimalan broj argumenata koje registri mogu sadržavati jest 6. RDI (prvi registar) sadrži sami format stringa („%p.%p….”). To znači da ako se unese veći broj formata od 5, formatirana funkcija uzme 5 argumenata iz preostalih pozicija u memoriji namijenjene za argumente te ostale argumente sa stoga koji prethode base pointeru.

Kupon

Opis zadatka:

https://platforma.hacknite.hr/challenges#Kupon-115

Jakov je napravio program za rezervaciju mjesta u svom restoranu. U programu je zapisao i kupon kod za besplatnu večeru. Jakov tvrdi da je trenutno nemoguće doći do njega, ali ako uspiješ smiješ ga iskoristiti.

Spoji se na program uz pomoć naredbe telnet (ako koristiš Windows) ili naredbe netcat (ako koristiš Linux):

  telnet chal.platforma.hacknite.hr 12012
		
  netcat chal.platforma.hacknite.hr 12012

Rješenje:

Na liniji koja sadrži:

printf(input)

nalazi se ranjivost string format reada. Unutar polja kupon veličine 48 bajtova nalazi se flag. Dakle potrebno je ispisati vrijednost flag-a sa stoga uz pomoć string format reada. Zbog poretka definiranja varijabli kupon pa input, na samom stogu će na nižoj adresi biti polje kupon, a zatim polje input (ovo ponekad nije istina zbog optimizacije stoga, no u ovom slučaju poredak je sačuvan, za provjeru uvijek je moguće ručno pregledati stog uz pomoć gdb-a). To znači da će se nakon poziva nove funkcije polje kupon nalaziti na adresama iznad postavljenje return adrese te nove funkcije. Ta područja su u x64 calling konvenciji namijenjena argumentima 7 pa nadalje. Dakle, ako u polje input upišemo %p.%p.%p.%p.%p.%p.%p.%p.%p.%p.%p prvih 5 %p će ispisati memorije unutar printf funkcije namijenjene za argumente 2-6, a preostalih 6 %p će ispisati sadržaj cijelog polja kupon (jer mu je veličina 48 bajtova, a jedan pointer je veličine 8 bajtova). Nakon ispisa danih adresa od 6. pointera pa nadalje jest sadržaj polja kupon. Taj sadržaj je potrebno provući kroz hex converter u tekst i time će se dobiti sadržaj polja kupon.


Napomena 1: Zbog little endian zapisa, %p format očekuje da su na nižim adresama bajtovi manjih potencija, a sami zapis stringa je poredan od niže adrese prema višoj zbog čega je svaki bajt stringa unutar pointera ispisan obrnutim redoslijedom. Posljedično tome završetak stringa (opisan s newline \n tj. \x0a u hex formatu) “proguta” 0 u ispisu pointera. Recimo da je ispis nekog pointer 0xa414141. Provlačenjem kroz konverter konvertirale bi se vrijednosti \xa4 \x14 \x14 \x10 što nije ispravno. Potrebno je nadodati 0 na početak danog pointera kako bi se ispisale ispravne vrijednosti: \x0a \x41 \x41 \x41.

Primjer lokalnog ispisa rješenja:

Primjer - Zadatak s Hacknite platforme - Format

Formatirani stringovi su česta pojava u programima. Znate li dovoljno o njima?

Spojite se na online servis naredbom

nc chal.platforma.hacknite.hr 13018 ako koristite Linux odnosno telnet chal.platforma.hacknite.hr 13018 ako koristite Windows

Hint: uploadali smo dio exploit koda koji vam daje return adresu funkciju

Pregledom koda možemo vidjeti da funkcija main sadrži ranjive pozive funkcije printf.

printf("Primjer 1) 523\n");
fgets(buf,sizeof(buf),stdin);
printf(buf,523);
printf("Primjer 2) \"Volim formatiranje\"\n");
fgets(buf,sizeof(buf),stdin);
printf(buf,"Volim formatiranje");
printf("Primjer 3) \'c\'\n");
fgets(buf,sizeof(buf),stdin);
printf(buf,'c');

Nakon upisa unosa u buffer ispisuje se formatirana vrijednost te se postupak ponavlja tri puta.

Također, očito je da je cilj zadatka pozvati funkciju getFlag().

void getFlag(){
   int fd = open("./flag.txt",0,0);
   char buf[100];
   int r = read(fd,buf,sizeof(buf));
   write(1,buf,r);
}

Plan rješavanja zadatka je sljedeći:

1) Format string read napadom dobiti adresu koja se nalazi na stogu (engl. stack)

2) Pomoću adrese dobivene format string read napadom izračunati adresu na stogu koja pohranjuje return adresu

3) Format string write napadom zamijeniti return adresu adresom getFlag funkcije

Kako bi sastavili payload za format string read napad, koristit ćemo gdb uz GEF ekstenziju (može se koristiti i pwndbg ili neka druga ekstenzija koja poboljšava funkcionalnosti gdb-a kako bi se olakšalo pisanje exploita, ali treba pripaziti na razlike u sintaksi naredbi tih ekstenzija).

Prvo moramo postaviti breakpoint na prvi ranjivi poziv funkcije printf , a zatim pokrenuti program.

Nakon toga naredbom telescope -l 25 možemo dobiti prvih 25 vrijednosti na stogu. Cilj nam je pronaći vrijednost na stogu koja je zapravo adresa neke druge vrijednosti na stogu.

Takve vrijednosti su u ispisu naredbe telescope označene ljubičastom bojom, alternativno možemo potvrditi da je adresa unutar raspona vrijednosti stoga pomoću “vmmap” naredbe.

Vrijednosti sa stoga se mogu dohvaćati pomoću format string argumenta %p, a umjesto ponavljanja vrijednosti %p mnogo puta dok ne dobijemo željenu vrijednost, možemo koristiti sintaksu %X$P gdje je X offset argumenta na stogu kojeg želimo dohvatiti.

Prva adresa koja tome odgovara je na offsetu 20 od vrha stacka (tj. rsp-a) prikazano crvenom strelicom. Jedan offset odgovara 8 bajtova pošto je to zadana veličina argumenta %p. Međutim za dohvatiti tu adresu format string read napadom potrebno je upisati %25$p, a ne %20$p zato što se po Linux call konvenciji prvih 5 argumenata uvijek nalaze u registrima. Stoga, tek nakon 5. argumenta se vrijednost krenu uzimati s vrha stoga.

Nakon toga je potrebno kroz debugger vidjeti koliki je offset od adrese koje smo dobili do pohranjene return adrese (pohranjenu return adresu možemo vidjeti npr. naredbom telescope $rbp).

Zatim je potrebno izmijeniti return adresu kako bi se skočilo na adresu getFlag funkcije.

Funkcija printf nudi funkcionalnost pisanja pomoću %n placeholdera. Placeholder “%n” kaže printf funkciji da zapiše broj znakova koji su se ispisali u tom printf pozivu na adresu argumenta. Pomoću placeholdera %n se može upisati integer vrijednost (4 bajta), a pomoću placeholdera %hn short vrijednost (2 bajta).

Primjerice poziv

printf("test%n", &val);

bi zapisao broj 4 u varijablu val.

U zadatku moramo napisati payload koji će zapisati adresu get_flag funkcije 0x00000000004011f6 - dobiveno pregledom memorije) na pohranjenu return adresu. Return adrese su zapisane u little-endian obliku.

Payload kojim možemo overwriteati return adresu s adresom get_flag funkcije (0x00000000004011f6 - dobiveno pregledom memorije) jest

"%10$n%64x%11$hn%4534x%12$hnaaaaa" + stack_ret_addr+4 + stack_ret_addr+2 + stack_ret_addr

.

Objašnjenje payloada:

%10$n - na adresu koja je deseti argument printfa upiši koliko se znakova do sad ispisalo u ovom printf pozivu - nije se ispisalo ništa, zato će se na deseti argument upisati 0 u integer obliku (4 bajta nula)

%64x - ispisuje hex vrijednost duljine 64 znakova

%11$hn - na adresu koja je 11. argument printfa upiši short vrijednosti 0x40 ( (jer se prethodno tome ispisalo 64 razmaka)

%4534x - ispisuje hex vrijednost duljine 4534 znakova

%12$hn - na adresu koja je 12. argument printfa upiši short vrijednost 0x11f6 (toliko znakova se ispisalo dosad 4534 + 64)

aaaa - padding kako bi payload s njime činio 32 bajta

stack_ret_addr+4 - adresa za gornja 4 bajta target adrese - ovo se interpretira kao 10. argument printf funkcije (prvih 5 su registri, sam payload do “aaaa” se interpretira kao 6-9 argument printf funkcije)

stack_ret_addr+2 - adresa na koju se treba upisati vrijednost 0x40

stack_ret_addr - adresa na koju se treba upisati vrijednost 0x11f6

Dijelovi payloada su sljedeći: %10$n, %64x, %11$hn, %4534x, %12$hn, aaaaa i stack_ret adrese.

Cilj jest upisati adresu getFlag funkcije, 0x00000000004011f6. Format adresa je u LSB obliku (manje vrijednosti dolaze prije).

Za ručno sastavljanja payloada, najprije se odrede dijelovi adrese i poredaju rastući. Najviših 4 bajta adrese getFlag funkcije su 0, zbog čega taj dio dolazi kao prvi argument. Ovisno o payloadu, poredak se može izmijeniti. Također, dobra je praksa podijeliti vrijednosti na short umjesto int jer ispis razmaka traje kraće. Umjesto ispisivanja 0x004011f6 znakova ispiše se najprije 0x40 i zatim 0x11f6.

Jednom kada se sastavi kostur payloada (poredak argumenata, ispis razmaka s %x i upis vrijednosti kroz %hn ili %n) potrebno je igrati se s poravnanjem. Odredi se pozicija prvog argumenta koji se nalazi iza trenutačne duljine stringa, npr. ako je duljina trenutačnog stringa 34 sljedeći višekratnih broja 8 jest 40 što znači da će prvi argument biti na poziciji 11 itd…

Pwntools

Automatiziranje exploita se može postići uz pomoć pwntoolsa. Objektu FmtStr se proslijedi funkcija za slanje i primanje payloada. Zatim se zabilježi na koju adresu se želi upisati proizvoljna vrijednost i na kraju se funkcija izvrši.

Na primjeru zadatka, slanje zadnjeg posljednjeg payloada bi izgledao na sljedeći način:

      format_string = FmtStr (execute_fmt=send_payload)
      format_string.write(stack_ret_addr,0x00000000004011f6)
      format_string.execute_writes()

Uz automatizirano exploitanje, mogu se kreirati payloadi itd… Više se može pročitati ovdje.

string_format_read.1738929889.txt.gz · Last modified: 2025/12/01 11:40 (external edit)

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki