전체 글

깃허브 : DongHun3946 백준 : a3989957
데이터셋 - 표준/개발용( ex. iris data) MNIST : 0~9 의 숫자를 필기체로 저장해놓은 것 MNIST 는 총 4개의 파일로 구성되어 있다. 학습용(6만개) 평가용( t 는 test, 10 k = 10000을 뜻함)   위에서 image 는 그림을 뜻하고 label 은 클래스(숫자)를 뜻한다. idx3, idx1 에서 1은 1byte 를 , 3은 3byte 를 뜻한다.mnist 데이터셋에서1번째 : 매직넘버(4 byte)2번째 : 이미지 개수(4  byte)3번째 : 이미지 행수(4 byte, 28행) 4번째 : 이미지 열수(4 byte, 28열)위 그림에서 총 byte 용량은 9,912,422 bytes 는 압축되기 전 47,040,016 bytes 이고 구성은   4 + 4 + 4 +..
https://lipcoder.tistory.com/187 허프만(Huffman) 트리를 이용한 텍스트 압축개요 허프만 코딩(Huffman coding)은 텍스트 압축을 위해 널리 사용되는 방법으로, 원본 데이터에서 자주 출현하는 문자는 적은 비트의 코드로 변환하여 표현하고 출현 빈도가 낮은 문자는 많은 비lipcoder.tistory.com요약 : 허프만 코드는 숫자의 빈도를 이용하여 만든 압축 코드를 말한다. (컴퓨터 네트워크에서 암호화, 복호화 과제와 비슷) 셀 정렬 병합정렬   기수정렬  정렬 중에는 퀵 정렬이 제일 좋다.
수업 - 289쪽 1번부터 5번까지 실습함실습 답 비번 : 1290 과제  - 292쪽 10, 11번
1. kmp 알고리즘kmp보다 보이어 무어가 더 좋다. (업그레이드된 버젼)  a는 접두사 밖에 없으므로 0ab 는 접두사가 a 접미사가 b 이므로 0aba 는 접두사가 a 접미사가 a 이므로 1abac 는 접두사가 a, 접미사가 c  또는 접두사가 ab, 접미사가 ac 이므로 0... abababac 에서 접두사와 접미사가 ab로 같으므로  bc 가 다르기 때문에 abac 를 2칸 뒤로 옮긴다. kmp 의 단점 :  문장이 길 경우에 접두사와 접미사가 같은지 확인하는 작업 또한 오래걸릴 수 있다.2. 보이어 무어 알고리즘보이어 무어는 끝에서부터 비교를 한다. 이번주 수요일 허프만코드 수업할 예정
반복문 끝까지 나감 과제.250p 6, 7번  251p 10, 11번
연습문제 답1. 1번2. 2번3. 4번4. 4번 4번 문제에서 h2(k) 는 h1(k) + 5 - (k mod 5 ) 의 결과가 나와야 한다.오토마타 넘어감 라빈카프는 문자열을 수치화 시켜서 비교하는 방식이다.앞에 5를 곱하는 이유는 c e b b 의 자릿수가 달라졌기 때문이다. +2 는 c를 뜻한다.두 번째 a2 부터는 a1 즉 전의 계산된 수를 가지고 계산하기 때문에 속도가 빨라진다.
공부 기록장
Dong_hun