Skip to content
Open
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
12 changes: 6 additions & 6 deletions beginner_source/data_loading_tutorial.py
Original file line number Diff line number Diff line change
Expand Up @@ -8,7 +8,7 @@
**번역** : `정윤성 <https://github.com/Yunseong-Jeong>`__, `박정환 <http://github.com/9bow>`__

머신러닝 문제를 푸는 과정에서 데이터를 준비하는데 많은 노력이 필요합니다.
PyTorch는 데이터를 불러오는 과정을 쉽게해주고, 또 잘 사용한다면 코드의 가독성도 보다 높여줄 수 있는 도구들을
PyTorch는 데이터를 불러오는 과정을 쉽게 해주고, 또 잘 사용한다면 코드의 가독성도 보다 높여줄 수 있는 도구들을
제공합니다. 이 튜토리얼에서 일반적이지 않은 데이터셋으로부터 데이터를 읽어오고
전처리하고 증가하는 방법을 알아보겠습니다.

Expand Down Expand Up @@ -62,7 +62,7 @@
# 1084239450_e76e00b7e7.jpg,70,236,71,257, ... ,128,312
#
# 이제 CSV에서 이미지 이름과 그에 해당하는 데이터(annotation)을 가져와 보겠습니다. 예시로 person-7.jpg가 있는
# 65번째 줄(row index number)을 가져오겠습니다.이미지 이름을 읽어 ``img_name`` 에 저장하고, 데이터는 (L, 2)
# 65번째 줄(row index number)을 가져오겠습니다. 이미지 이름을 읽어 ``img_name`` 에 저장하고, 데이터는 (L, 2)
# 배열인 ``landmarks`` 에 저장합니다. 이 때 L은 해당 행의 랜드마크의 개수입니다.

landmarks_frame = pd.read_csv('data/faces/face_landmarks.csv')
Expand Down Expand Up @@ -109,7 +109,7 @@ def show_landmarks(image, landmarks):
# 이제 데이터셋 클래스를 만들어보도록 하겠습니다.
# ``__init__`` 을 사용해서 CSV 파일 안에 있는 데이터를 읽지만,
# ``__getitem__`` 을 이용해서 이미지의 판독을 합니다.
# 이 방법은 모든 이미지를 메모리에 저장하지 않고 필요할때마다 읽기 때문에
# 이 방법은 모든 이미지를 메모리에 저장하지 않고 필요할 때마다 읽기 때문에
# 메모리를 효율적으로 사용합니다.
#
# 데이터셋의 샘플은 ``{'image': image, 'landmarks': landmarks}`` 의 사전 형태를 갖습니다.
Expand Down Expand Up @@ -153,7 +153,7 @@ def __getitem__(self, idx):

######################################################################
# 클래스를 인스턴스화 하고 데이터 샘플을 통해서 반복해봅시다.
# 첫번째 4개의 샘플의 크기를 출력 하고, 샘플들의 랜드마크(landmarks)를 보여줄 것 입니다.
# 처음 4개의 샘플의 크기를 출력 하고, 샘플들의 랜드마크(landmarks)를 보여줄 것입니다.
#

face_dataset = FaceLandmarksDataset(csv_file='data/faces/face_landmarks.csv',
Expand Down Expand Up @@ -183,7 +183,7 @@ def __getitem__(self, idx):
# 대부분의 신경망(neural networks)은 고정된 크기의 이미지를 입력으로 받는 것을 가정하고 있습니다.
# 그러므로 몇 가지 전처리 코드를 작성하도록 하겠습니다.
#
# 다음의 3가지의 변형(transforms)을 만들어 보겠습니다:
# 다음 3가지의 변형(transforms)을 만들어 보겠습니다:
#
# - ``Rescale``: 이미지의 크기를 조절합니다.
# - ``RandomCrop``: 이미지를 무작위로 자릅니다.
Expand Down Expand Up @@ -368,7 +368,7 @@ def __call__(self, sample):
#
# ``torch.utils.data.DataLoder`` 는 위와 같은 기능을 모두 제공해주는 반복자(iterator)입니다.
# 여기에 사용되는 매개변수(parameter)들은 명확해야 합니다.
# 관심있게 살펴볼 매개변수 중 하나느 ``collate_fn`` 입니다.
# 관심있게 살펴볼 매개변수 중 하나는 ``collate_fn`` 입니다.
# ``collate_fn`` 을 사용하여 샘플들을 어떻게 일괄적으로 처리해야 하는지를 지정할 수 있습니다.
# 하지만 대부분의 경우에는 기본 함수가 잘 동작합니다.

Expand Down