본문 바로가기

딥러닝8

ai에 대하여 3월 모평 6월 모평 9월 모평 점수가 60 89 90이면 대충 이었을 때 y=wx+b 라는 일차함수가 만들어진다. 여기서 w는 가중치라고 부르고 b는 편차라고 부른다. 대충 그었을 때 어떤 기울기가 가장 가깝다는 어떻게 찾을까?일차함수의 선에서 모평 점수와의 거리가 얼마나 되는지 그래프를 그어보면 2차 함수가 나온다.  그중 가장 가까운 기울기는 편차-기울기 그래프의 기울기가 0일때를 가르킨다. config는 model의 껍데기이다. 인퍼런스를 위해 계산해 놓은 pth, pt라는 가중치는 체크포인트라고 부른다. 무수히 많은 w와 b가 저장 되어있다.  data_root = 'data/kinetics600/videos_train' # 훈련 데이터_데이터 경로data_root_val = 'data/kine.. 2024. 12. 12.
mmaction의 Dockerfile설정하는 방법(docker-compose도) DockerfileARG PYTORCH="1.8.1"ARG CUDA="10.2" ARG CUDNN="7"#부터FROM nvcr.io/nvidia/ai-workbench/python-cuda120:1.0.3# Python 패키지 업데이트 및 PyTorch 설치RUN pip install pip --upgradeRUN pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118#까지ENV TORCH_CUDA_ARCH_LIST="6.0 6.1 7.0+PTX"ENV TORCH_NVCC_FLAGS="-Xfatbin -compress-all"ENV CMAKE_PREFIX_PATH="$(dirname $(which.. 2024. 12. 11.
다운로드 할 파일 총 용량 알아보는 법 코드:#!/usr/bin/env bash# URL 파일 경로URL_FILE=$1# URL 파일 존재 확인if [ ! -f "$URL_FILE" ]; then echo "Error: URL file '$URL_FILE' not found." exit 1fi# 전체 파일 크기 초기화total_size=0# 각 URL에 대해 파일 크기 확인while IFS= read -r url; do if [[ -z "$url" || "$url" =~ ^# ]]; then continue fi # 파일 크기 확인 (HEAD 요청) size=$(wget --spider --server-response "$url" 2>&1 | grep -i "Content-Length" | awk .. 2024. 12. 11.
인강) 코렙 시작하기 접속: https://colab.research.google.com/drive/1B7DO2Y0bADMHt4MxIgy91LnAnrVzg9XZ Google Colab NotebookRun, share, and edit Python notebookscolab.research.google.com 파일 -> 노트열기 -> 업로드 -> yolov3_inference.ipynb 선택!런타임 -> 런타임 유형변경 누르면 GPU가 뜸 !git clone https://github.com/ultralytics/yolov3!cd yolov3;pip install -qr requirements.txt(쉘 안에서 os명령어를 쓰려면 ! 느낌표를 앞에 붙여준다)--> 이 코드 실행을 시켰더니 yolov3 폴더가 생겼다 세션다시시.. 2024. 12. 11.
kinetics 600 데이터셋 비디오 특정클래스만 다운받기 경로:https://github.com/cvdfoundation/kinetics-dataset/blob/main/k600_downloader.sh kinetics-dataset/k600_downloader.sh at main · cvdfoundation/kinetics-datasetContribute to cvdfoundation/kinetics-dataset development by creating an account on GitHub.github.com 안에 내용:#!/bin/bash# Download directories varsroot_dl="k600"root_dl_targz="k600_targz"# Make root directories[ ! -d $root_dl ] && mkdir $root.. 2024. 12. 11.
딥러닝의 평균 전처리 시간, 평균 추론 속도, 평균 후처리 시간이란? 각 시간은 영상 처리 파이프라인에서의 단계별 성능임.1. 평균 전처리 시간 (Preprocess Time)의미입력 데이터를 모델에 맞게 전처리하는 데 걸리는 시간입니다. 예를 들어, 비디오 프레임을 읽고 모델이 요구하는 형태로 변환하는 과정이 포함됩니다.TSM이 요구하는 형태는?TSM 모델은 비디오 데이터를 처리할 때 시간에 따른 프레임의 순서와 구조를 중요하게 다룹니다. 이를 위해 TSM 모델은 다음과 같은 입력 형태를 요구합니다:  입력 형태 (Shape):(Batch, Channel, Frames, Height, Width)예를 들어, (1, 3, 8, 224, 224)는 1개의 샘플, 3개의 채널 (RGB), 8개의 프레임, 224x224 해상도를 의미합니다.프레임 수:TSM 모델은 한 번의 인퍼.. 2024. 12. 11.
TSM(Temporal Shift Module) train TSM은?TSM (Temporal Shift Module) 프레임 수: 8-16 프레임속도: 30-60 FPS (실시간 가능)정확도: Kinetics-400에서 74-76%PyTorch 구현: 공식 PyTorch 구현이 제공됨.GitHub 링크: https://github.com/open-mmlab/mmaction2/blob/main/configs/recognition/tsn/README.mdONNX 호환성: 모델 구조가 간단한 2D CNN 기반으로, ONNX로 손쉽게 변환 가능.특징: 2D CNN 모델에 Temporal Shift Module을 추가하여 시간적 정보를 효율적으로 반영. 계산량이 적어 경량 디바이스에 적합.Kinetics-400 모델 트레이닝 하기python tools/train.py $.. 2024. 12. 10.
mmdetection 장점, 백본, 모델에 대한 설명 장점: 뛰어난 구현 성능효율적인 모듈config를 기반으로 구성 백본이란?백본은 이미지나 비디오 프레임에서 저수준에서 고수준까지의 특징을 추출하는 신경망 구조. 백본은 주로 합성곱 신경망 (CNN) 기반으로 설계되며, 객체 탐지 모델의 초기 단계에서 사용됨. 예를 들어, 이미지에서:색상, 모서리, 질감과 같은 저수준 특징을 먼저 추출하고,이후 사물의 형태, 윤곽, 패턴과 같은 고수준 특징을 학습합니다.대표적인 백본 모델1. ResNet (Residual Network)구조: ResNet-18, ResNet-50, ResNet-101 등 다양한 깊이의 모델특징: **잔차 연결 (Skip Connection)**을 통해 깊은 네트워크에서도 Gradient Vanishing 문제를 완화합니다.2. Mobile.. 2024. 12. 10.