프로그램은 크게 instruction(명령)과 data로 구분되며, 일반적으로 4가지, 좀더 세분화 하면 5가지 정도 구분 할 수 있다.
--> 아래 그림 참조.
1) code 영역
- 코드 자체를 구성하는 메모리 영역으로 Hex파일이나 BIN파일 메모리다.
- 프로그램 명령이 위치하는 곳으로 기계어로 제어되는 메모리 영역이다.
2) data 영역
- 전역변수(global), 정적변수(static), 배열(array), 구조체(structure) 등이 저장된다.
가) 초기화 된 데이터는 data 영역에 저장되고,
나) 초기화 되지 않은 데이터는 BSS (Block Stated Symbol) 영역에 저장된다.
- 프로그램이 실행 될 때 생성되고 프로그램이 종료 되면 시스템에 반환 된다.
- 함수 내부에 선언된 Static 변수는 프로그램이 실행 될 때 공간만 할당되고, 그 함수가 실행 될 때 초기화 된다.
Q) data영역과 bss 영역을 구분 하는 이유?
컴파일 해서 이미지를 올릴 때 초기화 되지 않은 데이터까지 올리게 되면 ROM 사이즈가 커지기 때문에 구분하지 않았을까? -> 혹시 정확히 아시는 분은 답변 부탁 드립니다.
3) heap 영역
- 필요에 의해 동적으로 메모리를 할당 하고자 할 때 위치하는 메모리 영역으로 동적 데이터 영역이라고 부르며, 메모리 주소 값에 의해서만 참조되고 사용되는 영역이다.
- 이 영역에 데이터를 저장 하기 위해서 C는 malloc(), C++은 new() 함수를 사용한다.
4) stack 영역
- 프로그램이 자동으로 사용하는 임시 메모리 영역이다.
- 지역(local) 변수, 매개변수(parameter), 리턴 값 등 잠시 사용되었다가 사라지는 데이터를 저장하는 영역이다.
- 함수 호출 시 생성되고, 함수가 끝나면 시스템에 반환 된다.
- 스택 사이즈는 각 프로세스마다 할당 되지만 프로세스가 메모리에 로드 될 때 스택 사이즈가 고정되어 있어, 런타임 시에 스택 사이즈를 바꿀 수는 없다.
- 명령 실행시 자동 증가/감소 하기 때문에 보통 메모리의 마지막 번지를 지정 한다.
요약)
1) code(text), data, stack 영역은 컴파일러가 알아서 메모리영역을 결정한다. 즉 컴파일 할 때 data영역과 stack영역의 크기를 계산해서 필요한 메모리 공간을 가지고 된다. heap 영역은 개발자에 의해 프로그램 동작시 결정된다.
ex) C언어에서 배열 선언시 incomplete type으로 사용하면 컴파일 할 때 에러가 발생하게 된다.
2) code, data, heap 영역은 하위 메모리부터 할당되고, stack 영역은 상위 메모리부터 할당 된다.
3) SMA (Static Memory Allocation) : 정적 메모리, 메모리의 data 영역, stack 영역을 사용한다.
- Data 영역 : 프로그램 시작과 동시에 할당된 영역이 잡히고 끝나면 OS 에 반환한다.
- Stack 영역 : 함수 시작과 동시에 할당된 영역이 잡히고 끝나면 OS에 반환한다.
4) DMA (Dynamic Memory Allocation) : 동적 메모리, 메모리의 heap 영역을 사용한다.
- Heap 영역 : stack에서 pointer 변수를 할당하고, 그 pointer가 가리키는 heap 영역의 임의의 공간부터 원하는
크기 만큼 할당해 사용한다.
written by 브랜든 (v 1.1)
P.S 부족한 부분이나 잘못된 부분은 댓글 부탁드립니다. (by 브랜든)
4월26일-메모리(code,data,bss,heap,stack영역)
▶ 구체적인 메모리 영역
→ 함수안에 쓰는 변수(지역변수)로 stack영역에 들어간다.
함수가 여러번 실행되면 HEAP, STACK가 늘어날 수 있다.
만약 프로그램이 늘어나면 용량이 커지므로 코드영역이 늘어난다.
변수선언시 stack이 끝번지 주소를 나타내는 것은 아니지만 마지막 영역에 해당한다.
컴파일하면 code는 더이상 늘어나지 않는다.
→stack의 지역변수는 사용하고 소멸하므로 데이터 용량의 불확실성을 가지므로 밑에서부터 채워 올리고 heap은 위에서 부터 채워 내려진다. 용량의 불확실성은 컴파일러가 알아서 메모리영역을 선택(랜덤적)
-stack영역에서의 주소값은 시작주소는 밑에서부터(먼저선언된 순서) 그다음 주소는 순서대로 정해진다.
HEAP overflow-heap이 위에서부터 주소값을 채워져 내려오다가 stack영역을 침범하는 경우.
STACK overflow-stack영역이 heap을 침범.
-stack은 4kb를 기본으로 하는 경우가 많고 지역변수를 많이 쓰면 stack용량이 커지므로 적당히 쓰는것이 좋다. stack, heap는 기준이 없으므로 프로그램을 실행시켜봐야 알수 있다.
▶ex) int A선언 후 실행
먼저 컴파일시 생성되는 기계어가 코드위에 씌어지게 되는게 여기서는 int A 가 '4byte공간을 stack생성하라' 란 일종의 명령이 code영역에 들어간다. 이 때 실행파일을 하드디스크에서 .exe만드는데 여기에는 header(code,bss,data)가 실행파일을 만들때 앞에 함께 들어간다. 이 것을 윈도우에서는 PE (portable executive)라고 한다.
만들어진 .exe실행파일을 실행하면 운영체제가 실행되고 실행파일을 메모리에 적재(loader)한다. 그리고 실행시에 A가 메모리에 나타난다.
※리눅스용 프로그램을 윈도우에서 실행되지 않는 이유
(리눅스 elf, 윈도우 PE구조)이므로 앞에 내용을 붙이는 (header구조)가 다르기 때문에 실행되지 않는다.
ex1)
TYPE |
Name |
address |
int |
A |
bffff9d8 |
int |
B |
bffff9d4 |
→A가 먼저 선언됐는데 B의 주소값이 더 빠르다.
ex2)
1.각 변수에 출력 값을 보면 주소값이 stack영역의 주소값을 채우는 방식에 의해 아래서 부터 채워 올라가는 것을 볼수 있고 안쓰는 공간을 두는 이유는 최적화를 위해서이다.
*4byte 최적화 (bus에 최적화 한다는 의미)→그다음 2byte최적화가 이루어진다.
2.는 각 각의 함수는 code영역에 속하고 각 함수의 주소값을 출력한 것이다. 함수자체가 주소이므로 &쓸필요가 없다.
'엔지니어' 카테고리의 다른 글
컴퓨터 특수기호 이름 (152) | 2011.08.11 |
---|---|
RAID (320) | 2011.08.11 |
SNMP란 무엇인가요? (308) | 2011.08.11 |
grep (638) | 2011.08.11 |
GDB 명령어 (급한일 생길때 보는 G!D!B! 명령어) :: 네이버 블로그 (593) | 2011.08.10 |