많은 웹 애플리케이션은 상당한 분량의 정적 내용을 제공한다. 즉, 디스크에서 데이터를 읽어 응답을 위한 소켓에 써 넣는다. 이런 처리는 상대적으로 CPU를 거의 사용하지 않을 것 같지만 다소 비효율적이다. 즉, 먼저 커널이 디스크에서 해당 데이터를 읽어 커널-사용자 간 경계를 넘어 애플리케이션으로 밀어 낸다. 그러면 애플리케이션은 해당 데이터를 소켓에 써 넣기 위해 다시 커널-사용자 간 경계를 넘어 커널로 밀어 넣는다. 결과적으로 애플리케이션은 그저 디스크에서 데이터를 가져다가 소켓으로 옮기는 비효율적인 중개자인 셈이다.

데이터가 사용자-커널 간 경계를 넘나들려면 매번 복사를 해야 한다. 이 때 CPU 사이클과 메모리 대역폭이 소모된다. 다행히 무복사 기법을 사용하면 불필요한 복사를 피할 수 있다(참으로 적절한 이름이다). 무복사 기법을 사용하는 애플리케이션은 해당 데이터를 자신을 거치지 않고 커널이 직접 디스크에서 소켓으로 복사하도록 요청한다. 무복사 기법은 애플리케이션 성능을 크게 향상시키고 커널과 사용자 모드 간의 맥락 전환 수를 줄여 준다.

자바 클래스 라이브러리는 리눅스와 유닉스 시스템에서 java.nio.channels.FileChannel 클래스의 transferTo() 메서드를 통해 무복사 기법을 지원한다. transferTo() 메서드를 사용하면 메서드를 호출한 채널(channel)에서 다른 쓰기 가능한 바이트 채널로 데이터가 애플리케이션을 거칠 필요 없이 바이트들을 곧장 전송할 수 있다. 이 글에서는 먼저 기존 복사 방식으로 파일을 전송할 때 생기는 추가 부담을 보인 후, 어떻게 transferTo()를 사용한 무복사 기법이 더 나은 성능을 보이는지를 살펴 보겠다.

데이터 전송: 기존 방식

파일을 하나 읽어 네트워크를 통해 다른 프로그램에 전달하는 시나리오를 생각해 보자. 이 시나리오는 정적인 내용을 제공하는 웹 애플리케이션, FTP 서버, 메일 서버 등을 포함한 많은 서버 애플리케이션의 동작을 나타낸 것이다. 이런 동작의 핵심은 Listing 1(완전한 예제 코드가 필요하면 다운로드를 참고)의 두 호출에 있다.


Listing 1. 바이트들을 파일에서 소켓으로 복사하기

File.read(fileDesc, buf, len);
Socket.send(socket, buf, len);

Listing 1이 개념적으로는 단순할지 몰라도 내부적으로 이 복사 작업 동안 사용자 모드와 커널 모드 간에 맥락 전환이 네 차례 필요하다. 그림 1은 내부적으로 데이터가 어떻게 파일에서 소켓으로 옮겨지는지 나타낸 것이다.


그림 1. 기존 데이터 복사 방식
기존 데이터 복사 방식

한편 그림 2는 맥락 전환을 나타낸 것이다.


그림 2. 기존 방식에서 맥락 전환
기존 방식에서의 맥락 전환

이 작업은 다음 과정으로 이뤄진다.

  1. read() 호출이 사용자 모드에서 커널 모드로 맥락 전환을 일으킨다(그림 2). 내부적으로는 파일에서 데이터를 읽기 위해 sys_read()(또는 같은 기능을 하는 시스템 호출)가 호출된다. 첫 번째 복사(그림 1)는 직접 메모리 접근(direct memory access, 약자로 DMA) 엔진이 한다. 디스크에서 파일 내용을 읽어 커널 주소 공간 내 버퍼에 저장한다.

  2. 요청한 분량만큼의 데이터가 1의 읽기 버퍼에서 사용자 버퍼로 복사되고, read() 호출에서 리턴한다. 이 리턴으로 인해 커널에서 다시 사용자 모드로 또 다른 맥락 전환이 일어난다. 이제 읽어 온 데이터가 사용자 주소 공간 내 버퍼에 저장됐다.

  3. send() 소켓 호출로 인해 사용자 모드에서 커널 모드로 맥락 전환이 일어난다. 해당 데이터를 다시 커널 주소 공간의 버퍼에 넣기 위해 세 번째 복사가 일어난다. 하지만 이번에는 데이터가 목적 소켓에 연관된 다른 버퍼로 복사된다.

  4. send() 시스템 호출이 리턴하고 네 번째 맥락 전환이 일어난다. 그와 무관하며 비동기적으로 DMA 엔진이 데이터를 커널 버퍼에서 프로토콜 엔진으로 넘길 때 네 번째 복사가 일어난다.

중간에 커널 버퍼를 사용하는 것이 (해당 데이터를 직접 사용자 버퍼로 보내는 것보다) 비효율적으로 보일 수도 있다. 하지만 중간 커널 버퍼는 사실 성능을 향상시키기 위해 사용한 것이다. 읽는 쪽에서 중간 버퍼를 사용하면, 애플리케이션이 커널 버퍼에 담을 수 있는 양보다 적은 데이터를 요청했을 경우, 커널 버퍼가 일종의 "다음 데이터를 미리 읽어 두는 캐시(readahead cache)"처럼 동작할 수 있게 해 준다. 이렇게 하면 요청한 데이터의 양이 커널 버퍼 크기보다 작은 경우 성능이 많이 향상된다. 또한 중간 버퍼를 쓰는 쪽에서 사용하면 데이터를 비동기적으로 써 넣을 수 있다.

불행히 요청된 데이터의 크기가 커널 버퍼보다 큰 경우에는 이 접근법 자체가 성능 병목이 될 수 있다. 그런 경우 데이터가 애플리케이션에 최종적으로 전달되기까지 디스크, 커널 버퍼, 사용자 버퍼 간에 복사가 여러 번 일어난다.

무복사 기법은 이런 불필요한 데이터 복사를 없애 성능을 높인다.


데이터 전송: 무복사 방식

기존 방식을 다시 살펴 보면 두 번째와 세 번째 복사는 실제 필요하지 않음을 알 수 있을 것이다. 애플리케이션은 그저 데이터를 캐시했다가 소켓 버퍼로 보낼 뿐 아무런 일도 하지 않는다. 여기서 대신 데이터를 읽기 버퍼에서 소켓 버퍼로 직접 전송할 수 있다. transferTo() 메서드가 정확히 그런 일을 해 준다. Listing 2는 transferTo() 메서드의 시그너처(signature)다.


Listing 2. transferTo() 메서드

public void transferTo(long position, long count, WritableByteChannel target);

transferTo() 메서드는 데이터를 파일 채널에서 주어진 쓰기 가능한 바이트 채널로 전송한다. 내부적으로는 하부 운영체제가 무복사를 지원하는지 여부에 따라 다르다. 유닉스와 각양각색 리눅스의 경우 이 호출은 Listing 3에 보인 것처럼 sendfile() 시스템 호출로 연결된다. 이 시스템 호출은 데이터를 한 파일 디스크립터(file descriptor)에서 다른 파일 디스크립터로 전송한다.


Listing 3. sendfile() 시스템 호출

#include <sys/socket.h>
ssize_t sendfile(int out_fd, int in_fd, off_t *offset, size_t count);

Listing 1에서 file.read()socket.send() 호출이 행하는 작업을 Listing 4에 보인 것처럼 하나의 transferTo() 호출로 대체할 수 있다.


Listing 4. transferTo()를 이용하여 디스크 파일에서 소켓으로 데이터 복사하기

transferTo(position, count, writableChannel);

그림 3은 transferTo() 메서드를 사용할 때의 데이터 경로를 보인 것이다.


그림 3. transferTo()를 사용할 때 일어나는 데이터 복사
transferTo()를 사용할 때 일어나는 데이터 복사

그림 4에는 transferTo() 메서드를 사용할 때 일어나는 맥락 전환을 보였다.


그림 4. transferTo()를 사용할 때의 맥락 전환
transferTo()를 사용할 때의 맥락 전환

Listing 4에서와 같이 transferTo()를 사용할 때 작업이 처리되는 과정은 다음과 같다.

  1. transferTo() 메서드가 DMA 엔진을 이용, 파일 내용을 읽기 버퍼로 복사한다. 해당 데이터는 다음으로 커널에 의해 출력 소켓에 연결된 커널 버퍼로 복사된다.

  2. DMA 엔진이 1의 데이터를 커널 소켓 버퍼에서 프로토콜 엔진으로 넘기면서 세 번째 복사가 일어난다.

보는 바와 같이 개선점이 있다. 맥락 전환 횟수를 네 번에서 두 번으로 줄였고, 데이터 복사 횟수도 네 번에서 세 번으로 줄였다(게다가 이 중 단 한 번만 CPU를 사용한다). 하지만 이 정도로는 우리 목표인 무복사는 어림도 없다. 만약 네트워크 인터페이스 카드가 데이터 모으기(gather operation)를 지원한다면 커널이 행하는 데이터 복제를 더 줄일 수도 있다. 리눅스 커널 2.4 이후에서는 이런 요구를 수용하기 위해 소켓 버퍼 디스크립터가 수정되었다. 이 방식은 다수의 맥락 전환을 줄일 뿐 아니라 CPU를 사용하는 중복된 데이터 복사를 없애준다. 사용자 쪽에서 보면 변한 게 없지만 내부 동작은 바뀌었다.

  1. transferTo() 메서드가 DMA 엔진을 이용, 파일 내용을 커널 버퍼에 복사한다.

  2. 이번에는 소켓 버퍼에 데이터를 복사하지 않는다. 대신 데이터 위치와 길이에 대한 설명이 담긴 디스크립터들만 소켓 버퍼에 추가된다. DMA 엔진은 데이터를 직접 커널 버퍼에서 프로토콜 엔진으로 넘겨준다. 이로서 앞서 마지막으로 남아 있던 CPU를 이용한 복사 과정이 없어졌다.

그림 5는 transferTo()와 데이터 모으기를 이용한 데이터 복사를 보인 것이다.


그림 5. transferTo()와 데이터 모으기를 사용한 데이터 복사
transferTo()와 데이터 모으기를 사용한 데이터 복사


파일 서버 만들기

이제 파일을 클라이언와 서버 간에 전송하는 예제를 통해 무복사 기법을 실제 사용해 보자(예제 코드는 다운로드에 있다). TraditionalClient.javaTraditionalServer.javaFile.read()Socket.send()를 이용하는 기존 복사 방식을 사용한 것이다. TraditionalServer.java는 특정 포트(port)에 사용자가 접속하기를 기다리다가 일단 접속하면 소켓으로부터 한번에 4K 바이트씩 데이터를 읽는다. TraditionalClient.java는 서버에 접속해 (File.read()를 이용) 파일에서 데이터를 4K 바이트 읽어 그 내용을 (socket.send()를 사용해) 해당 소켓을 통해 서버로 보낸다.

비슷하게 TransferToServer.javaTransferToClient.java는 같은 기능을 하지만, 파일을 서버에서 클라이언트로 보내기 위해 기존 방식 대신 transferTo() 메서드를 사용한다(결과적으로 내부에서는 sendfile() 시스템 호출을 사용한다).

성능 비교

상기 예제 프로그램들을 2.6 커널을 사용하는 리눅스 시스템에서 실행해, 다양한 크기에 대해 기존 방식과 transferTo() 방식의 실행 시간을 밀리초 단위로 측정했다.


표 1. 성능 비교: 기존 방식 대 무복사 방식

파일 크기 일반 파일 전송(ms) transferTo(ms)
7MB 156 45
21MB 337 128
63MB 843 387
98MB 1320 617
200MB 2124 1150
350MB 3631 1762
700MB 13498 4422
1GB 18399 8537

여기서 보는 것처럼 transferTo() API는 기존 방식에 비해 실행 시간을 약 65% 줄여준다. 이는 웹 서버처럼 하나의 I/O 채널에서 다른 채널로 많은 양의 데이터를 복사하는 애플리케이션에 있어 상당한 성능 향상을 가져다 줄 수 있다.


요약

이 글을 통해 하나의 채널에서 데이터를 읽어 다른 채널에 써 넣는 것과 비교해 transferTo()를 사용하는 경우의 성능 이점을 보였다. 중간 버퍼 복사는 (비록 커널 내에 감춰져 있지만) 무시할 수 없는 비용을 초래한다. 채널 간에 많은 양의 데이터를 복사하는 애플리케이션에서는 무복사 기법이 상당한 성능 향상을 가져다 줄 수 있을 것이다.



다운로드 하십시오

설명 이름 크기 다운로드 방식
이 글의 예제 프로그램 j-zerocopy.zip 3KB HTTP

다운로드 방식에 대한 정보


 

참고자료

교육

  • "Zero Copy I: User-Mode Perspective"(Dragan Stancevic, Linux Journal, 2003년 1월): 무복사 기법과 sendfile()에 대해 더 알아보자.

  • "An Efficient Zero-Copy I/O Framework for UNIX"(Moti N. Thadani와 Yousef A. Khalidi, 썬 마이크로시스템즈, 1995년 5월): 이 논문은 애플리케이션 프로그램과 유닉스 커널 간의 버퍼 관리와 교환을 위한 무복사 프레임워크를 소개한다.

  • transferTo(): java.nio.channels.FileChannel 클래스의 transferTo() 메서드에 대한 Javadoc 문서

필자소개

Sathiskumar Palaniappan은 IBM 인도 연구소 자바 기술 센터의 시스템 소프트웨어 엔지니어다.

Pramod B. Nagaraja는 IBM 인도 연구소 자바 기술 센터의 소프트웨어 엔지니어다.

 

 

출처 : http://www.ibm.com/developerworks/kr/library/j-zerocopy/index.html

 /**
  * SHA-256 으로 암호화된 passwd 를 반환.
  * @param str
  * @return hashed string.
  */
 public static String makeSHApasswd(String str){
  
  int interNb = 1000;
  byte[] byteArray =byteArrFromStr("osungbnk");
  StringBuilder x = new StringBuilder();
  
  try {
   if(!"".equalsIgnoreCase(str)){ //
    byte[] retVal = getHash(interNb, str, byteArray);

    for(int i=0; i<retVal.length; i++){
     x.append(String.format("%x", retVal[i]));
    }
   }
  } catch (NoSuchAlgorithmException e) {
   e.printStackTrace();
  } catch (UnsupportedEncodingException e1) {
   e1.printStackTrace();
  }
  
  return x.toString();
 }

SHA-256 패스워드 생성

Program_Language/Java 2012. 4. 4. 14:18 Posted by Request

/**
     * 입력된 password 로 SHA-256 hashCode 생성.
     * @return byte[]
     */
    public static byte[] getHash(int iterationNb, String password, byte[] salt) throws NoSuchAlgorithmException, UnsupportedEncodingException {

        MessageDigest digest = MessageDigest.getInstance("SHA-256");

        digest.reset();
        digest.update(salt);

        byte[] input = digest.digest(password.getBytes("UTF-8"));

        for (int i = 0; i < iterationNb; i++) {
            digest.reset();
            input = digest.digest(input);
        }

        return input;
    }

자바 기초편 1

Program_Language/Java 2011. 8. 24. 18:27 Posted by Request

1.list와 vector 차이점
1)벡터는 임의 접근 가능, 리스트는 불가능
2)삽입과 삭제 시 리스트는 물리적 X, 벡터는 물리적 이동 함.
3)링크 구조로 인해 리스트의 메모리 소모량은 벡터보다 더 많고 삽입, 삭제 시 노드 할당, 제거 과정 반복해서 메모리 관리에 좋지 않다.
4)삽입, 삭제 시 벡터는 반복자 무효화, 리스트는 반복자 무효화 x

벡터는 읽기에 강하고 리스트는 쓰기에 강하다.

2.jsp 내장 객체 종류
-JSP 내에서 선언하지 않고 사용 할수 있는 객체
1)request : HTML FORM 요소 선택 값과 같은 사용자 입력 정보를 읽어 올때 사용.
2)response : 사용자 요청에 대한 응답을 처리할때 사용
3)session : 클라이언트 세션 정보를 처리하기 위해 사용
4)application : 웹서버의 애플리케이션 처리와 관련된 정보를 참조하기 위해 사용(javax.servlet.ServletContext)
5)out : 사용자에게 전달하기 위한 output 스트림 처리하기 위해 사용
6)config : 현재 jsp에 대한 초기화 환경을 처리하기 위해 사용
7)page : 현재 JSP 페이지에 대한 클래스 정보
8)exception : 예외 처리 사용

3. 싱글톤패턴이란?
-프로젝트 진행시 전 영역에 걸쳐 하나의 클래스의 단 하나의 인스턴스만을 생성하는 것을 말합니다.

4.string 과 stringBuffer 차이점
-string은 내용을 변경 할수 없기 때문에
String에서 + 연산자를 사용하면 내부적으로 stringBuffer를 생성하여 append()를 이용해서 문자열을 결합합니다.


5.J쿼리와 프로퍼티 설명


 

List의 크기를 반복해서 구할 필요가 없다.

위에서 1번으로 제시된 것처럼 get(int index) 를 쓰는 방법을 쓸 때도 아래와 같은 코드를 많이 보게 됩니다.

 

for( int i = 0; i < list.size(); i++){

//일하기

}

 

흔하게 보는 코드죠? 그런데 위 코드에도 굳이 필요없는 성능의 손실이 있습니다. 바로 list의 크기를 구하는 size() 메서드가 매번 반복해서 호출된다는 것입니다. 반복문 내에서 list의 크기가 변하는 경우가 아니라면 for문의 초기화 때 한번으로 충분합니다.

for(int i = 0, n = list.size(); i < n; i++){

//일하기

}

[출처 : http://benelog.egloos.com/1382604]

싱글톤은 무엇인가?

Program_Language/Java 2011. 2. 1. 17:34 Posted by Request

package foms.common;

import java.io.BufferedReader;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.InputStreamReader;
import java.util.HashMap;
import java.util.Vector;

/*
 2011.02.01 작성
 각종 코드 리스트들을 추출하여 쓰기 위해 ( DB트랜잭션 최소화) 만듦
 작성자 : 나도몰라
 Singleton pattern 으로 제작.
*/
public class codeList {
 private static codeList instance = new codeList();
 private static HashMap codeListData =new HashMap();
 
 final static String fileUrl ="C:/program1/KDN/Forms/WebContent/test/inspection_list.txt";
 
 /*Creator*/
 private codeList(){
  System.out.println("Creat Object ~");
 }
 
 /*싱글톤 패턴 : 메모리에 단 한번 올라가고 올라간후에는 계속 재사용을 한다. 상단 해쉬맵 포함.*/
 public static codeList getInstance(){
  if(null==instance){
   instance = new codeList();
  }
  return instance;
 }
 
 /* 순시종류 출력을 위한 메쏘드*/
 public static String getCodeName(String codeValue){
  String codeName ="";
  try{
     commonFileAccess(fileUrl);
        codeName = (String) codeListData.get(codeValue);
  }catch(Exception ex){
   ex.printStackTrace();
  }
  return codeName;
 }

 /*공통파일처리 메쏘드*/
 protected static HashMap commonFileAccess(String fileLink){
  
  try{
   if(codeListData.isEmpty()){
    System.out.println("FILE READING Start~~~~");
    FileInputStream fis = new FileInputStream(fileLink);
          BufferedReader br = new BufferedReader(new InputStreamReader(fis));
          String buff = null;
          int index = 0;
          while((buff = br.readLine()) != null){
              String[] items = buff.split(",");
              for (String item : items) {
               codeListData.put(items[0],items[1]);
              }
          }
   }
  }catch(Exception e){
   e.printStackTrace();
  }
    
  return codeListData;
 }
}

synchronized(this) 에 대해..

Program_Language/Java 2011. 2. 1. 12:28 Posted by Request

synchronized()... 일종의 하나의 쓰레드만 사용하기위해 다른 쓰레드에 대해서는
lock를 걸어 주기 위해 사용 한다고 하는데..

그만큼 느려질수도 있는 단점이 있다는군...

보통 어느 때 주로 사용 될까?

두 문자열을 비교 할때 잘못 알고 사용 하는 것 주의 하나가 문자열 동등비교를 ==로 한다는 것이다.
이것은 너무나 위험한 일이다.
언뜻 보기에는 버그로 보이지 않고 컴파일 시에도 에러가 발생하지 않는다.

하지만 이것은 찾아 내기 어려운 버그가 될수도 있고 치명적인 결과가 나타날수도 있다.
왜냐하면, 문자열의 비교에 있어서 == 은 두 문자열이 단지 같은 저장공간에 있는가 만을 비교하기 때문이다.


String A="aaa";
String B="aaa";

if(A==B)    <--- (X)
if(A.equals(B))  <---(O)

같은 문자열 일지라도 저장시킬때 다른 저장공간에 저장이 되어 있다면 이 둘의 동등비교시 ==을
사용하게 되면 이것은 false를 반환하게 된다.

그러므로 문자열 비교는 반드시 equals를 사용 해야 한다.

equalslgnoreCase : 두 문자열 비교 시 대소문자를 비교하지 않는다는 기능과
두 문자열의 비교시 우선 두 문자열의 길이가 같은지 먼저 확인함.

스크랩 : http://www.usingtech.co.kr/zboard/zboard.php?id=Java_Tip&page=2&sn1=&divpage=1&sn=off&ss=on&sc=on&select_arrange=headnum&desc=asc&no=4


JAVA Review Second Day~

Program_Language/Java 2010. 11. 4. 22:55 Posted by Request

1. 타입의 이해
- 타입을 쓰는 이유는?
☞타입별 메모리 크기 확보


2.식별자 역할: 데이터가 저장된 공간의 주소를 담는다.

3.연산자 역할 : 데이터를 확보된 공간에 할당한다.
할당된 주소값을 얻는다. 얻은 주소값을 누구에게 줄까?
바로~~~~ 식별자


4.데이터의 역할 : 연사자와 함께 비연산자로 사용된다.

5.return 이란?
연산을 수행하면 반드시 결과값을 되돌려 줘야 한다. 또한 타입도 되돌려줄때 사용한다.

6.연산은 메소드내에서만 이루어진다.

7.메소드의 구역은 어디인가?
{} 중괄호이다.



Java 복습 1일차

Program_Language/Java 2010. 10. 21. 00:13 Posted by Request
/**
 *
 * @작성자 : 이태훈
 * DATE : 2010-10-20
 * DESC : 클래스 구조 이해
 * */

//타입의 구성 요소 3가지
//필드(멤버변수) + 메소드(멤버메소드) + 생성자 메소드

  //1.필드 : 타입 선언
 //2.생성자메소드 : 선언된 곳에 데이터 할당 (타입이 없는 메소드를 생성자라고 한다.)
 //3.메소드 : 연산 수행

//클래스
public class NewType{
//필드 선언
    int i;
    double d;
    char c;
    boolean b;

// 생성자 
//생성자는 클래스명과 같다.
//생성자는 메모리공간을 생성하지 않는다.
    NewType(){
     i=10;
     d=45.5;
     c='a';
     b=true;
    }
}

================================================================
Data         d       =    new Data();
//타입  식별자          객체(상수,오브젝트)

================================================================================================

메소드 내에서 선언되는 것을 지역 변수라고 한다.
//지역변수는 static를 안 써도 된다.