파이썬 이미지 뷰어 만들기

데이터셋을 구글에서 크롤링 했는데 생각보다 중간중간 쓰레기 값들이 끼여져 있어서 이것을 폴더에서 미리보기로 지우려니 힘들어서 뷰어을 만들어서 삭제를 하기로 마음을 먹었다. 4개의 버튼이 존재한다. Open File Directory  .jpg .jpeg .png .JPEG .JPG .gif .GIF .PNG 파일을 전부 읽어서 순서대로 보여준다. Prev,Next 는 이전, 다음사진을 보여준다. 방향키 <-,-> 를 가지고 조작이 가능하다. Remove 버튼을 누르면 해당…

더 보기

Ubuntu 18.04 conky widget(cpu,ram,gpu,network)

위와 같은 위젯을 우분투에서 만들어 보려고 한다.  평소에 Docky 에서 있는 위젯을 사용하진 하였는데 이번에 포멧을 하면서 위젯이 있으면 좋겠다고 생각하여 위젯을 설치하였다. apt-get updateapt-get install conky-allsudo sed -i ‘s/left/right/’ /etc/conky/conky.confcp /etc/conky/conky.conf ~/.conkyrc 위 까지 실행후 conky를 bash 에서 실행한다. 그러면 좌측 상단에 conky widget이 생기는 것을 볼 수 있다.  이것을 시작프로그램에 등록한후  vim .conkyrc를 다음과…

더 보기

Image Restoration Using Very Deep Convolutional Encoder-Decoder Networks with Symmetric Skip Connections

denoising and superresolution 에 적용 가능한 모델 특징 symmetric convolution (convolution-deconvolution) encode-decode 구조 skip connections 을 이용 (U-Net구조) 더 깊은 모델을 생성 가능 구조  input image size 243×243 n개 layer 3×3 stride conv layer n개 deconv layer skip connection 학습 Adam 사용 lr 1e-4 50 × 50 patch Berkeley Segmentation Dataset (BSD)300 이미지를 사용denoise를 위해서는 gaussian…

더 보기

Floating point

위키 피디아의 내용을 살짝 정리 IEEE754 (fp32) 으로  fixed point decimal 을 floating point binary로 변환하는 방법 −118.625 (십진법)을 IEEE 754 (32비트 단정도)로 표현해 보자. 음수이므로, 부호부는 1이 된다. 그 다음, 절댓값을 이진법으로 나타내면 1110110.101이 된다. (이진기수법을 참조) 소수점을 왼쪽으로 이동시켜, 왼쪽에는 1만 남게 만든다. 예를 들면 1110110.101=1.110110101×2⁶ 과 같다. 이것을 정규화된 부동소수점 수라고 한다.((가수)×(밑수)(지수)표현법에서 가수의…

더 보기

Speech recognition(음성인식) (2) 특징 추출(feature extraction)

이전 포스트에서는 음성인식의 개요와 사람이 어떻게 음성을 인식하는지에 대해 다루어 보았다 이번 포스트에서는  공학적으로 음성 인식을 어떻게 적용할지에 대하여 다우어 보겠다. 이전 포스트에서 위 waveform에서 어떻게 word sequence 를 추출할지에 대하여 질문을 던졌다. 위 그림만 봐서는 어떤 word인지 감을 잡을 수 없으나 무었인가 규칙이 있을 것 같다. 위는 각기 다른사람이 bird를 발음 한것이다.  음운적으로 비슷한가? 그러면…

더 보기

ubuntu 에서 windows 사용하기 (gnome-boxes)

우분투를 사용하며 가끔씩 윈도우를 사용해야할 때가 있어서 간단하게 사용 할 수 있는 gnome-boxes 라는 VM을 이용하여 windows를 설치하여 보았다. 설치 sudo apt-get updatesudo apt-get install gnome-boxes 실행 터미널에 gnome-boxes& 라고 입력하면 다음과 같이 실행된다. 윈도우 설치 링크에서 윈도우10 iso 를 다운로드 한다. gnome-boxes 에서 새로만들기를 클릭 한 후 iso 파일을 클릭한다. 세부설정을 완료한후 만들기를 클릭한다. 윈도우…

더 보기

Speech recognition(음성인식) (1) 개요

2018/9/20 일 전면_수정 음성인식이란? 음성 인식이란 사람이 말하는 음성 언어를 컴퓨터가 해석해 그 내용을 문자 데이터로 전환하는 처리를 말합니다. 음성 인식은 아날로그 음성 신호를 디지털로 바꾸는 신호 처리부터 시작하여 신호의 음성적인 특징을 추출하는 일을 말하며 이는 자연어 처리와 같은 응용분야에 있어서도 중요한 역할을 할 수  밖에 없기에 중요한 분야입니다. 응용분야 Human Speech Recognition Process 음성인식문제에…

더 보기

NVLINK란? 간단한 정리

NVLINK에 대한 정보를 찾던중 ULTRA-PERFORMANCE PASCAL GPU AND NVLINK INTERCONNECT 을  정리 전반적인 특징 Pascal Architecture에서는 Maxwell Architecture과 비교해서 다음과 같은 변화가 생겼다. (Tesla시리즈의 비교기때문에 모든 제품에 적용하기에는 무리가 있다.) 특징들 Tesla M40 Tesla P100 architecture GM200/Maxwell GP100/Pascal Streaming multiprocessors 24 56 FP16(반정밀도) flops/clock/SM -(FP16연산유닛이 없다) 256 FP32(단정밀도) flops/clock/SM 256 128 FP64(배정밀도) flops/clock/SM 8 64 GPU…

더 보기