Protokół Gadu-Gadu

© Copyright 2001, 2002 Autorzy


0. Informacje wstępne

Opis protokołu używanego przez Gadu-Gadu bazuje na doświadczeniach przeprowadzonych przez autorów oraz informacjach nadsyłanych przez użytkowników. Żaden klient Gadu-Gadu nie został skrzywdzony podczas badań. Reverse-engineering opierał się głównie na analizie pakietów wysyłanych między klientem a serwerem.


1. Protokół Gadu-Gadu

1.1. Format pakietów

Podobnie jak coraz większa ilość komunikatorów, Gadu-Gadu korzysta z protokołu TCP/IP. Każdy pakiet zawiera na początku dwa stałe pola:

        struct gg_header {
		int type;	/* typ pakietu */
		int length;	/* długość reszty pakietu */
	};

Wszystkie zmienne liczbowe są zgodne z kolejnością bajtów maszyn Intela, czyli Little-Endian.

Przy opisie struktur, założono, że char ma rozmiar 1 bajtu, short 2 bajtów, int 4 bajtów. Używając innych architektur niż i386 należy zwrócić szczególną uwagę na rozmiar typów zmiennych i kolejność znaków.

Pola, który znaczenie jest nieznane, lub nie do końca jasne, oznaczono przedrostkiem unknown.


1.2. Zanim się połączymy

Żeby wiedzieć, z jakim serwerem mamy się połączyć, należy poudawać przez chwilę przeglądarkę WWW i połączyć się z hostem appmsg.gadu-gadu.pl.

	GET /appsvc/appmsg.asp?fmnumber=NUMER HTTP/1.0
	Host: appmsg.gadu-gadu.pl
	User-Agent: Mozilla/4.7 [en] (Win98; I)
	Pragma: no-cache

Oryginalny klient może wysłać jeden z podanych identyfikatorów przeglądarki:

	Mozilla/4.04 [en] (Win95; I ;Nav)
	Mozilla/4.7 [en] (Win98; I)
	Mozilla/4.0 (compatible; MSIE 5.0; Windows NT; DigExt)
	Mozilla/4.0 (compatible; MSIE 5.0; Windows NT)
	Mozilla/4.0 (compatible; MSIE 5.0; Windows 98; DigExt)
	Mozilla/4.0 (compatible; MSIE 5.0; Windows 98)

Nowsze wersje (od 4.6.2) korzystają z innego skryptu:

	GET /appsvc/appmsg2.asp?fmnumber=NUMER&version=WERSJA&fmt=FORMAT&lastmsg=WIADOMOŚĆ
	Host: appmsg.gadu-gadu.pl
	User-Agent: ...
	Pragma: no-cache

Gdzie NUMER jest numerem klienta, WERSJA jest wersją klienta, FORMAT określa czy wiadomość systemowa będzie przesyłana czystym tekstem (brak zmiennej "fmt") czy w HTMLu (jakakolwiek jej wartoś.), a WIADOMOŚĆ jest numerem ostatnio otrzymanej wiadomości systemowej. Na postawione w ten sposób zapytanie, serwer powinien odpowiedzieć na przykład tak:

	HTTP/1.0 200 OK
	
	0 217.17.41.84:8074 217.17.41.84

Pierwsze pole jest numerem wiadomości systemowej, a drugie i trzecie podają nam namiary na właściwy serwer. Jeśli serwer jest niedostępny, zamiast adresu IP jest zwracany tekst ,,notoperating''. Jeżeli połączenie z portem 8074 nie powiedzie się z jakichś powodów, można się łączyć na port 443.

Jeśli pierwsza liczba nie jest równa zero, zaraz po nagłówku znajduje się wiadomość systemowa, lub jeśli linia zaczyna się od znaku ,,@'', adres strony, którą należy otworzyć w przeglądarce.


1.3. Logowanie się

Po połączeniu się portem 8074 lub 443 serwera Gadu-Gadu, dostajemy pakiet typu 0x0001, który na potrzeby tego dokumentu nazwiemy:

	#define GG_WELCOME 0x0001

Reszta pakietu zawiera liczbę, na podstawie której liczony jest hash z hasła klienta:

	struct gg_welcome {
		int seed;	/* klucz szyfrowania hasła */
	};

Kiedy mamy już tą wartość możemy odesłać pakiet logowania

	#define GG_LOGIN 0x000c

Musimy podać kilka informacji:

	struct gg_login {
		int uin;		/* numer klienta */
		int hash;		/* hash hasła */
		int status;		/* początkowy stan */
		int version;		/* wersja klienta */
		int local_ip;		/* mój adres ip */
		short local_port;	/* port, na którym słucham */
	};

Hash hasła w pierwszych wersjach był liczony w dość prosty sposób, ale niestety z którąś zmianą protokołu wprowadzono nowy algorytm:

	int gg_login_hash(char *password, int seed)
	{
		unsigned int x, y, z;

		y = seed;

		for (x = 0; *password; password++) {
			x = (x & 0xffffff00) | *password;
			y ^= x;
			y += x;
			x <<= 8;
			y ^= x;
			x <<= 8;
			y -= x;
			x <<= 8;
			y ^= x;

			z = y & 0x1f;
			y = (y << z) | (y >> (32 - z));
		}

		return y;
	}

Liczba oznaczająca wersję może być jedną z poniższych:

WartośćWersje klientów
0x184.9.3
0x174.9.2
0x164.9.1
0x154.8.9
0x144.8.3, 4.8.1
0x114.6.10, 4.6.1
0x104.5.22, 4.5.21, 4.5.19, 4.5.17, 4.5.15
0x0f4.5.12
0x0b4.0.30, 4.0.29, 4.0.28, 4.0.25

Oczywiście nie są to wszystkie możliwe wersje klientów, lecz te, które udało się złapać na wolności. Najbezpieczniej będzie przedstawiać się jako ta wersja, której własności używamy. Wiadomo, że wersje 4.0 nie obsługiwały trybu ukrytego, tylko dla znajomych itd.

W najnowszej wersji protokołu jest dodatkowa maska na wersję:

	#define GG_HAS_AUDIO_MASK 0x40000000

która mówi nam, że dany klient może prowadzić rozmowy głosowe.

Jeśli wszystko się powiedzie, dostaniemy w odpowiedzi pakiet typu:

      #define GG_LOGIN_OK 0x0003

o zerowej długości, lub w przypadku błędu pakiet:

      #define GG_LOGIN_FAILED 0x0009

Od wersji 4.9.3 (protokół 0x18), możliwe jest również wykorzystanie przekierowania portów. Jeśli chcemy wykorzystać, należy zamiast pakietu GG_LOGIN wysłać następujący:

	#define GG_LOGIN_EXT 0x0013

	struct gg_login_ext {
		int uin;		/* numer klienta */
		int hash;		/* hash hasła */
		int status;		/* początkowy stan */
		int version;		/* wersja klienta */
		int local_ip;		/* mój adres ip */
		short local_port;	/* port, na którym słucham */
		int external_ip;	/* zewnętrzny adres ip */
		short external_port;	/* zewnętrzny port */
	};


1.4. Zmiana stanu

Gadu-Gadu przewiduje kilka stanów klienta, które zmieniamy pakietem typu:

	#define GG_NEW_STATUS 0x0002

	struct gg_new_status {
		int status;		/* na jaki zmienić? */
		char description[];	/* opis, nie musi wystąpić */
		int time;		/* czas, nie musi wystąpić */
	}

Możliwe stany to:

EtykietaWartośćZnaczenie
GG_STATUS_NOT_AVAIL0x0001Niedostępny
GG_STATUS_NOT_AVAIL_DESCR0x0015Niedostępny (z opisem)
GG_STATUS_AVAIL0x0002Dostępny
GG_STATUS_AVAIL_DESCR0x0004Dostępny (z opisem)
GG_STATUS_BUSY0x0003Zajęty
GG_STATUS_BUSY_DESCR0x0005Zajęty (z opisem)
GG_STATUS_INVISIBLE0x0014Niewidoczny
GG_STATUS_INVISIBLE_DESCR0x0016Niewidoczny z opisem
GG_STATUS_BLOCKED0x0006Zablokowany
GG_STATUS_FRIENDS_MASK0x8000Maska bitowa oznaczająca tryb tylko dla przyjaciół

Należy pamiętać, żeby przed rozłączeniem się z serwerem należy zmienić stan na GG_STATUS_NOT_AVAIL lub GG_STATUS_NOT_AVAIL_DESCR. Jeśli ma być widoczny tylko dla przyjaciół, należy dodać GG_STATUS_FRIENDS_MASK do normalnej wartości stanu.

Jeśli wybieramy stan opisowy, należy dołączyć ciąg znaków zakończony zerem oraz ewentualny czas powrotu w postaci ilości sekund od 1 stycznia 1970r (UTC). Maksymalna długość opisu wynosi 40 znaków plus zero plus 4 bajty na godzinę powrotu, co razem daje 45 bajtów.


1.5. Ludzie przychodzą, ludzie odchodzą

Zaraz po zalogowaniu możemy wysłać serwerowi naszą listę kontaktów, żeby dowiedzieć się, czy są w danej chwili dostępni. Pakiet zawiera maksymalnie 409 struktur gg_notify:

	#define GG_NOTIFY 0x0010
	
	struct gg_notify {
		int uin;	/* numerek danej osoby */
		char type;	/* rodzaj użytkownika */
	};

Gdzie pole type przyjmuje następujące wartości:

EtykietaWartośćZnaczenie
GG_USER_NORMAL0x03Zwykły użytkownik dodany do listy kontkatów
GG_USER_BLOCKED0x04Użytkownik, którego wiadomości nie chcemy otrzymywać

Jeśli nie mamy nikogo na liście wysyłamy pakiet:

	#define GG_LIST_EMPTY 0x0012

o zerowej długości.

Jeśli ktoś jest, serwer odpowie pakietem zawierającym jedną lub więcej struktur gg_notify_reply:

	#define GG_NOTIFY_REPLY 0x000c	/* tak, to samo co GG_LOGIN */
	
	struct gg_notify_reply {
		int uin;		/* numerek */
		int status;		/* status danej osoby */
		int remote_ip;		/* adres ip delikwenta */
		short remote_port;	/* port, na którym słucha klient */
		int version;		/* wersja klienta */
		short unknown1;		/* znowu port? */
		char description[];	/* opis, nie musi wystąpić */
		int time;		/* czas, nie musi wystąpić */
	};

Większość pól powinna być zrozumiała. remote_port poza zwykłym portem może przyjmować również poniższe wartości:

WartośćZnaczenie
0Klient nie obsługuje bezpośrednich połączeń
1Klient łączy się zza NAT lub innej formy maskarady
2Klient nie ma nas w swojej liście kontaktów

Zdarzają się też inne ,,nietypowe'' wartości, ale ich znaczenie nie jest jeszcze do końca znane.

Jeśli dany klient jest w stanie z podanym opisem, najpierw dostaniemy informację osobnym pakietem o nim, później paczkę struktur gg_notify_reply z ludźmi, którzy nie mają ustawionych opisów.

Żeby dodać kogoś do listy w trakcie pracy, trzeba wysłać niżej opisany pakiet. Jego format jest identyczny jak przy GG_NOTIFY.

	#define GG_ADD_NOTIFY 0x000d
	
	struct gg_add {
		int uin;	/* numerek */
		char type;	/* rodzaj użytkownika */
	};

By usunąć z listy kontaktów, wysyła się podobny pakiet:

	#define GG_REMOVE_NOTIFY 0x000e
	
	struct gg_add {
		int uin;	/* numerek */
		char type;	/* rodzaj użytkownika */
	};

Jeśli ktoś opuści Gadu-Gadu lub zmieni stan, otrzymamy pakiet:

	#define GG_STATUS 0x0002
	
	struct gg_status {
		int uin;	/* numerek */
		int status;	/* nowy stan */
	};


1.6. Wysyłanie wiadomości

Wiadomości wysyła się następującym typem pakietu:

	#define GG_SEND_MSG 0x000b

	struct gg_send_msg {
		int recipient;		/* numer odbiorcy */
		int seq;		/* numer sekwencyjny */
		int class;		/* klasa wiadomości */
		char message[];		/* treść */
	};

Numer sekwencyjny jest wykorzystywany przy potwierdzeniu dostarczenia lub zakolejkowania pakietu. Nie jest wykluczone, że w jakis sposób odróżnia się różne rozmowy za pomocą części bajtów, ale raczej nie powinno mieć to ma znaczenia. Klasa wiadomości pozwala odróżnić, czy wiadomość ma się pojawić w osobnym okienku czy jako kolejna linijka w okienku rozmowy. Jest to mapa bitowa, więc najlepiej ignorować te bity, których znaczenia nie znamy:

EtykietaWartośćZnaczenie
GG_CLASS_QUEUED0x0001Bit ustawiany wyłącznie przy odbiorze wiadomości, gdy wiadomość została wcześniej zakolejkowania z powodu nieobecności
GG_CLASS_MSG0x0004Wiadomość ma się pojawić w osobnym okienku
GG_CLASS_CHAT0x0008Wiadomość jest częścią toczącej się rozmowy i zostanie wyświetlona w istniejącym okienku
GG_CLASS_CTCP0x0010Wiadomość jest przeznaczona dla klienta Gadu-Gadu i nie powinna być wyświetlona użytkownikowi.
GG_CLASS_ACK0x0020Klient nie życzy sobie potwierdzenia wiadomości.

Długość treści wiadomości nie powinna przekraczać 2000 znaków.

Oryginalny klient wysyłając wiadomość do kilku użytkowników, wysyła po kilka takich samych pakietów z różnymi numerkami odbiorców. Nie ma osobnego pakietu do tego. Natomiast jeśli chodzi o połączenia konferencyjne do pakietu doklejana jest następująca struktura:

	struct gg_msg_recipients {
		char flag;		/* == 1 */
		int count;		/* ilość odbiorców */
		int recipients[];	/* tablica odbiorców */
	};

Na przykład, by wysłać do dwóch osób, należy wysłać pakiet:

OffsetWartość
nTreść wiadomości
m0x01
m + 10x02
m + 2
m + 3
m + 4
m + 5Numer pierwszego adresata
m + 6
m + 7
m + 8
m + 9Numer drugiego adresata
m + 10
m + 11
m + 12

Od wersji 4.8.1 możliwe jest również dodawanie do wiadomości różnych atrybutów tekstu jak pogrubienie czy kolory. Niezbędne jest dołączenie następnującej struktury:

	struct gg_msg_richtext {
		char flag;	/* == 2 */
		short length;	/* długość dalszej części */
	};

Dalsza część pakietu zawiera odpowiednią ilość struktur o łączej długości określonej polem length:

	struct gg_msg_richtext_format {
		short position;	/* pozycja atrybutu w tekście */
		char font;	/* atrybuty czcionki */
		char rgb[3];	/* kolor czcionki, nie musi wystąpić */
	};

Każda z tych struktur określa kawałek tekstu począwszy od znaku określonego przez pole position (liczone od zera) aż do następnego wpisu lub końca tekstu. Pole font jest mapą bitową i kolejne bity mają następujące znaczenie:

EtykietaWartośćZnaczenie
GG_FONT_BOLD0x01Pogrubiony tekst
GG_FONT_ITALIC0x02Kursywa
GG_FONT_UNDERLINE0x04Podkreślenie
GG_FONT_COLOR0x08Kolorowy tekst. Tylko w tym wypadku struktura gg_msg_richtext_format zawiera pole rgb[] będące opisem trzech składowych koloru, kolejno czerwonej, zielonej i niebieskiej.

Dla przykładu, by przesłać tekst ,,ala ma kota'', należy dołączyć do wiadomości następującą sekwencję bajtów:

OffsetWartośćZnaczenie
n0x02Opis atrybutów tekstu...
n + 10x0006...mający 6 bajtów długości
n + 2
n + 30x0004Atrybut zaczyna się od pozycji 4...
n + 4
n + 50x01...i jest to pogrubiony tekst
n + 60x0006Atrybut zaczyna się od pozycji 6...
n + 7
n + 80x00...i jest to zwykły tekst

Serwer po otrzymaniu wiadomości odsyła potwierdzenie, które przy okazji mówi nam, czy wiadomość dotarła do odbiorcy czy została zakolejkowana z powodu nieobecności. Otrzymujemy je w postaci pakietu:

	#define GG_SEND_MSG_ACK 0x0005
	
	struct gg_send_msg_ack {
		int status;	/* stan wiadomości */
		int recipient;	/* numer odbiorcy */
		int seq;	/* numer sekwencyjny */
	};

Numer sekwencyjny i numer adresata są takie same jak podczas wysyłania, a stan wiadomości może być jednym z następujących:

EtykietaWartośćZnaczenie
GG_ACK_DELIVERED0x0002Wiadomość dostarczono
GG_ACK_QUEUED0x0003Wiadomość zakolejkowano
GG_ACK_MBOXFULL0x0004Wiadomości nie dostarczono. Skrzynka odbiorcza na serwerze jest pełna (20 wiadomości maks). Występuje tylko w trybie offline
GG_ACK_NOT_DELIVERED0x0006Wiadomości nie dostarczono. Odpowiedź ta występuje tylko w przypadku wiadomości klasy GG_CLASS_CTCP


1.7. Otrzymywanie wiadomości

Wiadomości serwer przysyła za pomocą pakietu:

	#define GG_RECV_MSG 0x000a
	
	struct gg_recv_msg {
		int sender;		/* numer nadawcy */
		int seq;		/* numer sekwencyjny */
		int time;		/* czas nadania */
		int class;		/* klasa wiadomości */
		char message[];		/* treść wiadomości */
	};

Czas nadania jest zapisany w postaci UTC, jako ilości sekund od 1 stycznie 1970r. W przypadku pakietów ,,konferencyjnych'' na końcu pakietu doklejona jest struktura identyczna z gg_msg_recipients zawierająca pozostałych rozmówców.

1.8. Ping, pong

Od czasu do czasu klient wysyła pakiet do serwera, by oznajmić, że połączenie jeszcze jest utrzymywane. Jeśli serwer nie dostanie takiego pakietu w przeciągu 5 minut, zrywa połączenie. To, czy klient dostaje odpowiedź zmienia się z wersji na wersję, więc najlepiej nie polegać na tym.

	#define GG_PING 0x0008
	
	#define GG_PONG 0x0007


1.9. Rozłączenie

Jeśli serwer zechce nas rozłączyć, wyśle wcześniej pusty pakiet:

	#define GG_DISCONNECTING 0x000b

Ma to miejsce, gdy próbowano zbyt wiele razy połączyć się z nieprawidłowym hasłem, lub gdy równocześnie połączy się drugi klient z tym samym numerem (nowe połączenie ma większy priorytet).

2. Usługi HTTP

Opis znajduje się w pliku http.txt.


3. Bezpośrednie połączenie

Opis znajduje się w pliku dcc-protocol.txt.


4. Autorzy

Autorami powyższego opisu są:

  • Wojtek Kaniewski (wojtekka%irc.pl): pierwsza wersja opisu, poprawki, utrzymanie wszystkiego w porządku.
  • Robert J. Woźny (speedy%atman.pl): opis nowości w protokole GG 4.6, poprawki.
  • Tomasz Jarzynka (tomee%cpi.pl): badanie timeoutów.
  • Adam Ludwikowski (adam.ludwikowski%wp.pl): wiele poprawek, wersje klientów, rozszerzone wiadomości, powody nieobecności.
  • Marek Kozina (klith%hybrid.art.pl): czas otrzymania wiadomości.
  • Rafał Florek (raf%regionet.regionet.pl): opis połączeń konferencyjnych.
  • Igor Popik (igipop%wsfiz.edu.pl): klasy wiadomości przy odbieraniu zakolejkowanej.
  • Rafał Cyran (ajron%wp.pl): informacje o remote_port, rodzaje potwierdzeń przy ctcp, GG_LOGIN_EXT.
  • Piotr Mach (pm%gadu-gadu.com): ilość kontaktow, pełna skrzynka, pusta lista, maska audio, usługi HTTP, GG_LOGIN_EXT.
  • Adam Czyściak (acc%interia.pl): potwierdzenie wiadomości GG_CLASS_ACK.
  • Kamil Dębski (kdebski%kki.net.pl): czas w stanach opisowych.
  • Paweł Piwowar (alfapawel%go2.pl): format czasu.

$Id: protocol.html,v 1.15 2002/10/16 13:18:52 wojtekka Exp $