파이썬에서 주어진 픽셀의 RGB 값을 읽는 방법은 무엇입니까?
로 ,open("image.jpg")
픽셀의 좌표가 있다고 가정하면 픽셀의 RGB 값을 어떻게 얻을 수 있습니까?
그럼, 이 반대는 어떻게 해야 하나요?빈 그래픽으로 시작하여 특정 RGB 값을 가진 픽셀을 '쓰기'하시겠습니까?
추가 라이브러리를 다운로드하지 않아도 된다면 더 좋습니다.
Python Image Library를 사용하여 이 작업을 수행하는 것이 가장 좋습니다. 유감스럽게도 별도의 다운로드입니다.
원하는 작업을 수행하는 가장 쉬운 방법은 배열처럼 조작할 수 있는 픽셀 액세스 개체를 반환하는 Image 개체의 load() 메서드를 사용하는 것입니다.
from PIL import Image
im = Image.open('dead_parrot.jpg') # Can be many different formats.
pix = im.load()
print im.size # Get the width and hight of the image for iterating over
print pix[x,y] # Get the RGBA Value of the a pixel of an image
pix[x,y] = value # Set the RGBA Value of the image (tuple)
im.save('alive_parrot.png') # Save the modified pixels as .png
또는 이미지를 생성하기 위한 훨씬 더 풍부한 API를 제공하는 ImageDraw를 보십시오.
Pillow(Python 3.X 및 Python 2.7+와 함께 작동)를 사용하여 다음 작업을 수행할 수 있습니다.
from PIL import Image
im = Image.open('image.jpg', 'r')
width, height = im.size
pixel_values = list(im.getdata())
이제 모든 픽셀 값이 표시됩니다. 또는 를 RGB로 수 경우im.mode
그러면 픽셀을 얻을 수 있습니다.(x, y)
기준:
pixel_values[width*y+x]
또는 Numpy를 사용하여 배열 모양을 변경할 수 있습니다.
>>> pixel_values = numpy.array(pixel_values).reshape((width, height, 3))
>>> x, y = 0, 1
>>> pixel_values[x][y]
[ 18 18 12]
사용이 간편한 완벽한 솔루션은
# Third party modules
import numpy
from PIL import Image
def get_image(image_path):
"""Get a numpy array of an image so that one can access values[x][y]."""
image = Image.open(image_path, "r")
width, height = image.size
pixel_values = list(image.getdata())
if image.mode == "RGB":
channels = 3
elif image.mode == "L":
channels = 1
else:
print("Unknown mode: %s" % image.mode)
return None
pixel_values = numpy.array(pixel_values).reshape((width, height, channels))
return pixel_values
image = get_image("gradient.png")
print(image[0])
print(image.shape)
코드 테스트 연기
너비/높이/채널 순서가 불확실할 수 있습니다.이러한 이유로 다음 그라데이션을 만들었습니다.
이미지의 너비는 100px이고 높이는 26px입니다.색상 구배가 있습니다.#ffaa00
~ (노란색) ~#ffffff
은 다음과 같습니다출력은 다음과 같습니다.
[[255 172 5]
[255 172 5]
[255 172 5]
[255 171 5]
[255 172 5]
[255 172 5]
[255 171 5]
[255 171 5]
[255 171 5]
[255 172 5]
[255 172 5]
[255 171 5]
[255 171 5]
[255 172 5]
[255 172 5]
[255 172 5]
[255 171 5]
[255 172 5]
[255 172 5]
[255 171 5]
[255 171 5]
[255 172 4]
[255 172 5]
[255 171 5]
[255 171 5]
[255 172 5]]
(100, 26, 3)
주의할 사항:
- 모양은 (폭, 높이, 채널)입니다.
- 그
image[0]
첫행에는 의 트리플이 .
PyPNG - 경량 PNG 디코더/인코더
비록 그 질문이 JPG를 암시하지만, 저는 제 대답이 몇몇 사람들에게 유용하기를 바랍니다.
PyPNG 모듈을 사용하여 PNG 픽셀을 읽고 쓰는 방법은 다음과 같습니다.
import png, array
point = (2, 10) # coordinates of pixel to be painted red
reader = png.Reader(filename='image.png')
w, h, pixels, metadata = reader.read_flat()
pixel_byte_width = 4 if metadata['alpha'] else 3
pixel_position = point[0] + point[1] * w
new_pixel_value = (255, 0, 0, 0) if metadata['alpha'] else (255, 0, 0)
pixels[
pixel_position * pixel_byte_width :
(pixel_position + 1) * pixel_byte_width] = array.array('B', new_pixel_value)
output = open('image-with-red-dot.png', 'wb')
writer = png.Writer(w, h, **metadata)
writer.write_array(output, pixels)
output.close()
PyPNG는 테스트 및 주석을 포함하여 4000줄 미만의 단일 순수 Python 모듈입니다.
PIL은 보다 포괄적인 이미징 라이브러리이지만 훨씬 더 무겁습니다.
데이브 웹의 말처럼:
다음은 이미지에서 픽셀 색상을 인쇄하는 작업 코드 조각입니다.
import os, sys import Image im = Image.open("image.jpg") x = 3 y = 4 pix = im.load() print pix[x,y]
photo = Image.open('IN.jpg') #your image
photo = photo.convert('RGB')
width = photo.size[0] #define W and H
height = photo.size[1]
for y in range(0, height): #each pixel has coordinates
row = ""
for x in range(0, width):
RGB = photo.getpixel((x,y))
R,G,B = RGB #now you can use the RGB value
Pillow라는 라이브러리를 사용하면 나중에 프로그램에서 쉽게 사용할 수 있도록 여러 번 사용해야 할 경우 이 라이브러리를 기능으로 만들 수 있습니다.이 기능은 단순히 이미지의 경로와 "잡으려는" 픽셀의 좌표를 가져옵니다.이미지를 열고 RGB 색 공간으로 변환한 다음 요청한 픽셀의 R, G, B를 반환합니다.
from PIL import Image
def rgb_of_pixel(img_path, x, y):
im = Image.open(img_path).convert('RGB')
r, g, b = im.getpixel((x, y))
a = (r, g, b)
return a
*참고: 저는 이 코드의 원래 작성자가 아닙니다. 설명 없이 남겨졌습니다.설명하기가 꽤 쉽기 때문에, 저는 단지 아래에 있는 누군가가 그것을 이해하지 못할 경우를 대비해서, 저는 단지 그 설명을 제공하는 것입니다.
이미지 조작은 복잡한 주제이며 라이브러리를 사용하는 것이 가장 좋습니다.파이썬 내에서 다양한 이미지 형식에 쉽게 접근할 수 있는 gd모듈을 추천할 수 있습니다.
위키에 정말 좋은 글이 있습니다.wxpython.org 의 제목은 이미지 작업입니다.이 문서에서는 wxWidgets(wxImage), PIL 또는 PythonMagick을 사용할 수 있다고 언급합니다.개인적으로, 저는 PIL과 wxWidgets를 사용했고 둘 다 이미지 조작을 꽤 쉽게 만듭니다.
당신은 파이게임의 서프어레이 모듈을 사용할 수 있습니다.이 모듈에는 pixel3d(표면)라는 3d 픽셀 배열 반환 방법이 있습니다.아래에 사용법이 나와 있습니다.
from pygame import surfarray, image, display
import pygame
import numpy #important to import
pygame.init()
image = image.load("myimagefile.jpg") #surface to render
resolution = (image.get_width(),image.get_height())
screen = display.set_mode(resolution) #create space for display
screen.blit(image, (0,0)) #superpose image on screen
display.flip()
surfarray.use_arraytype("numpy") #important!
screenpix = surfarray.pixels3d(image) #pixels in 3d array:
#[x][y][rgb]
for y in range(resolution[1]):
for x in range(resolution[0]):
for color in range(3):
screenpix[x][y][color] += 128
#reverting colors
screen.blit(surfarray.make_surface(screenpix), (0,0)) #superpose on screen
display.flip() #update display
while 1:
print finished
도움이 되었으면 합니다.마지막 단어: 스크린픽스의 수명 동안 화면이 잠깁니다.
Tkinter 모듈은 Tk GUI 툴킷에 대한 표준 Python 인터페이스이며 추가 다운로드가 필요하지 않습니다.https://docs.python.org/2/library/tkinter.html 을 참조하십시오.
(Python 3의 경우 Tkinter는 Tkinter로 이름이 변경됨)
RGB 값을 설정하는 방법은 다음과 같습니다.
#from http://tkinter.unpythonic.net/wiki/PhotoImage
from Tkinter import *
root = Tk()
def pixel(image, pos, color):
"""Place pixel at pos=(x,y) on image, with color=(r,g,b)."""
r,g,b = color
x,y = pos
image.put("#%02x%02x%02x" % (r,g,b), (y, x))
photo = PhotoImage(width=32, height=32)
pixel(photo, (16,16), (255,0,0)) # One lone pixel in the middle...
label = Label(root, image=photo)
label.grid()
root.mainloop()
RGB를 가져옵니다.
#from http://www.kosbie.net/cmu/spring-14/15-112/handouts/steganographyEncoder.py
def getRGB(image, x, y):
value = image.get(x, y)
return tuple(map(int, value.split(" ")))
sudo apt-get install python-imaging 명령을 사용하여 PIL을 설치하고 다음 프로그램을 실행합니다.이미지의 RGB 값이 인쇄됩니다.이미지가 크면 '>'를 사용하여 출력을 파일로 리디렉션하고 나중에 파일을 열어 RGB 값을 확인합니다.
import PIL
import Image
FILENAME='fn.gif' #image can be in gif jpeg or png format
im=Image.open(FILENAME).convert('RGB')
pix=im.load()
w=im.size[0]
h=im.size[1]
for i in range(w):
for j in range(h):
print pix[i,j]
import matplotlib.pyplot as plt
import matplotlib.image as mpimg
img=mpimg.imread('Cricket_ACT_official_logo.png')
imgplot = plt.imshow(img)
RGB 색상 코드의 형태로 세 자리가 필요한 경우 다음 코드를 사용하면 됩니다.
i = Image.open(path)
pixels = i.load() # this is not a list, nor is it list()'able
width, height = i.size
all_pixels = []
for x in range(width):
for y in range(height):
cpixel = pixels[x, y]
all_pixels.append(cpixel)
이것은 당신에게 도움이 될 것입니다.
언급URL : https://stackoverflow.com/questions/138250/how-to-read-the-rgb-value-of-a-given-pixel-in-python
'source' 카테고리의 다른 글
spring-boot:run과 spring-boot:start의 차이점은 무엇입니까? (0) | 2023.07.15 |
---|---|
git --git-timeout이 예상대로 작동하지 않습니다. (0) | 2023.07.15 |
엔티티 매핑에서 시퀀스의 증분 크기는 [50]으로 설정되고 연결된 데이터베이스 시퀀스 증분 크기는 [1]입니다. (0) | 2023.07.15 |
요소가 배열에 있는지 확인하는 방법 (0) | 2023.07.15 |
파이썬 멀티스레드는 모든 스레드가 완료될 때까지 기다립니다. (0) | 2023.07.15 |