포인터는 C언어의 가장 기본이라고 할 수 있다. 포인터는 C에 존재하는 모든 자료형에 대해 존재하는데, 예를 들면 int에 대한 포인터, char에 대한 포인터, float에 대한 포인터 등의 형태로 사용된다.
포인터의 본질은 메모리의 주소값을 가진다는 점이다. 포인터에 관련해서는 아래 두개의 중요한 연산자가 있다.
이 연산자들의 의미를 살펴보기 위해 아래와 같이 변수를 선언했다고 해보자.
int i;
int *pi;
여기서 i는 int형 변수(integer variable)이고 p는 int형에 대한 포인터(a pointer to integer)다.
포인터 변수는 메모리의 주소값을 가진다고 했으므로 아래와 같이 사용할 수 이싿.
pi = &i;
&는 주소연산자라고 했는데, 이 연산자를 사용할 경우 해당 변수의 메모리 주소값을 반환한다. 따라서 pi에는 i의 메모리 주소값이 저장이 된다.
변수라는 것은 결국 메모리 주소에 불과하다. 변수에 데이터를 담을 수 있다는 의미는 결국 메모리에 데이터를 저장할 수 있다는 것과 동일하다. 일일히 0x00ffcc22등과 같이 주소를 지정해서 쓰면 오류가 나기 쉽고 (절대주소) 매우 번거롭기에 변수라는 기능을 사용해서 메모리에 저장하는 방식을 택하는 것이다.
포인터의 의미를 좀 더 명확하게 하기 위해 아래의 예시를 확인해보자.
i = 10;
*pi = 10;
pi = 10;
먼저 위의 두가지의 경우 의미가 동일하다. i가 가리키고 있는 메모리 주소에 정수로 10을 저장해주세요 라는 의미이다. pi=10; 구문은 pi에 저장되어 있는 i의 주소값으로 가서 정수 10을 저장해주세요 라고 해석한다. 자기 자신이 i는 아니지만, i가 가리키는 메모리에 접근하여 값을 저장하고 쓸 수 있기 떄문에 는 간접 참조 연산자로 불리는 것이다.
세번째 구문은 어떤 의미일까? 잘못된 연산일까? 전혀 그렇지 않다. 어찌됐건 포인터변수도 하나의 변수이고, 값을 저장할 수 있는 공간이다. 포인터 변수 자체의 메모리 주소도 물론 있다. 다만 포인터 변수에 담긴 값이 주소로 해석될 뿐이다. 10이라는 데이터는 0x000000a 형태로 메모리에 잘 저장이 된다. 문법적으로 이상이 없다.
다만, 세번째 구문에서 주의해야 할 점은 10을 저장할 수는 있지만 간접지정은 할 수 없다는 얘기다. 할 수는 있지만 큰 문제가 발생할 것이다. 이 주소에 대한 간접지정이 위험한 이유는 주로 메모리값 초기 앞부분은 커널영역이 차지하고 있기 떄문이다. 커널영역이라 함은 컴퓨터 프로그램의 아주 베이스인 OS 등이 차지하고 있는 영역을 의미한다. 이 영역을 건드리면 우리가 당장 사용하는 Windows, masOS, Linux 등이 정상적으로 작동할 수 없을 것이다.
포인터는 주소값을 가지는 변수이기 때문에 다양한 자료형에 대한 주소를 가질 수 있다.
또한 주소값의 경우 언제나 양수이기 때문에 포인터를 가지고 더하기, 빼기, 곱하기, 나눗셈 연산 등도 얼마든지 가능하다. 물론 값이기 때문에 비교연산 또한 가능하다.
포인터의 크기는 보통 4bytes지만, 컴퓨터에 따라 다를 수 있다.
포인터의 사이즈가 4bytes(32bit)인 이유는 주소값의 형태가 보통 0x00ff00ff 형식으로 되어 저장되기 떄문이다. 0x 이후로 8개의 숫자가 있고 각 자리들이 16진수(4bits)로 구성되어 있기에 4bits 8 = 32bits(4bytes)가 되는 것이다.*
상수정의란 정수에 이름을 붙여주는 것이라 생각하면 편합니다. #define 이름 상수값 형태로 문법을 사용하며 변수랑은 개념이 완전히 다르다. 변수는 데이터를 저장할 수 있는 하나의 메모리 저장공간이지만, 매크로로 정의된 상수는 데이터를 저장할 수 없다. 그냥 이름만 존재하는 것이다. 변수의 경우 l-value 라고 보통 부르고, 매크로 등과 같이 상수의 경우는 r-value라고 부른다. int 변수 = 10; 의 형태로 저장되기에 왼쪽 오른쪽에다 각각 value를 붙여준 것이다.
0의 값을 갖는 null pointer, NULL 매크로를 우리는 C에서 아래와 같이 사용할 수 있다.
if(pi == NULL) or if(!pi)
둘 다 의미는 동일하다. 만약 포인터 변수 pi가 아무런 값도 가리키고 있지 않다면(즉, 0x00000000 값을 가지고 있다면?) 이란 뜻이다.
우리는 프로그램을 짤 때 완벽하게 설계할 수 없음을 스스로 잘 알고있다. 얼마나 메모리 공간을 필요로 하는지도 모르고, 만약 안다고 해도 뒤에가서 바뀔 수도 있다. 이렇게 가변적인 상황이 발생할 수 있기 떄문에 C에서는 힙(heap)이라는 메커니즘을 제공한다. 힙은 런타임 시(실행 시) 메모리를 할당해주는 역할을 한다
우리는 메모리가 필요할 떄 마다 malloc 함수 호출을 통해 원하는 만큼의 메모리를 요청할 수 있다. 메로리공간에 여유가 있어 요청이 성공적으로 받아들여지면, 내가 요청한 크기의 메모리 덩어리의 시작주소가 반환된다. 만약 내가 malloc함수로 4bytes 만큼의 메모리를 요구했다고 가정해보자. 그럼 컴퓨터는 메모리 어딘가ㅡ예를들어 0x00ffcc01~0x00ffcc08ㅡ까지를 할당해 주기로 정했다고 해보자. 이 경우 malloc으로 반환되는 값은 0x00ffcc01이라는 뜻이다.
만약 메모리 공간이 부족하거나 다른 이유로 요천ㅇ이 거절당했을 경우, NULL이 리턴된다. NULL은 아까 null pointer를 정수 0 으로 산수정의 한 것이라고 설명했다. 0이 리턴된다고 봐도 무방하다.
메모리가 더 이상 필요 없어졌을 경우, free 함수호출로 메모리를 시스템에 반환할 수 있다. 그냥 malloc을 사용하면 무조건 free를 해줘야 한다는 사실을 일단 기억해 놓자. 한번 메모리가 반환되면, 다시 사용할 수 없다. 물론, 그 주소가 어디인지 정확히 값으로 알고 있다면 언제든지 가능하다. 그러나 보통 우리는 주소를 변수 형식으로 사용하고 주소는 운영체제가 알아서 할당해주므로 그 위치를 다시 찾기란 거의 불가능하다.
동적할당에 대한 개념과 포인터의 개념을 정리ㅐ 볼겸 아래의 프로그램을 살펴보자.
*************************************************
** 포인터와 동적할당에 대한 프로그램 예시
*************************************************/
#include <stdio.h>
#include <malloc.h>
void main()
{
int i, *pi; // int형 변수 i와 int형 포인터변수 pi를 선언
float f, *pf; // float형 변수 f와 float형 포인터변수 pf를 선언
pi = (int *)malloc(sizeof(int));
pf = (float *)malloc(sizeof(float));
*pi = 1024;
*pf = 3.14;
printf("an integer = %d, a float = %f\n", *pi, *pf);
free(pi);
free(pf);
}
/*************************************************
** End Line
*************************************************/
출처: https://mattlee.tistory.com/28?category=683544 [waca's field]
malloc 함수를 호출할 때는 그 인자로 얼마만큼의 데이터를 어떤 형식으로 저장할건지를 명시해줘야 한다. malloc 함수의 반환값은 시스템마다 다르다. 어떤 시스템에서 char 로 반환되기도 한다. 하지만 American National Standarad Institute(ANSI) C를 사용하는 유저라면 그 반환값은 void 이다. 포인터이긴 포인터인데, void 형을 가리키는 포인터이다. 우리가 이 예시에서 사용하는 것은 int와 float로 void와는 다르다.
따라서 목적성에 맞게 사용하기 위하여 malloc 함수 앞에 강제형변환(type cast) 문을 넣어주었다. free의 경우 매개변수는 void 타입을 기대한다. 하지만 다른 어떤 타입의 포인터도 괜찮다. 매개변수로 넘어온 포인터는 void 로 강제 형변환이 되므로 어떤 포인터든 넘어가도 된다.
항상 C프로그래밍을 하면서 포인터 변수를 선언할 때는 NULL로 초기화 시켜놓는것이 좋다. 이유는 프로그램의 영역을 넘어서는 혹은 비정상적인 영역에 대한 접근을 원천적으로 차단하기 위해서이다.