keras.layers.Layer中无法定义name的问题及解决

软件发布|下载排行|最新软件

当前位置:首页IT学院IT技术

keras.layers.Layer中无法定义name的问题及解决

唐僧爱吃唐僧肉   2023-03-20 我要评论

keras.layers.Layer中无法定义name问题

在使用keras之中定义层的时候,如果按照以下的方法直接在keras.layers.Layer中定义相应的self.name

会发生相应的报错

import params as pp
import params_flow as pf
import tensorflow as tf
import tensorflow.keras as keras
class MyParams(tf.keras.layers.Layer):   
    def __init__(self):
        super(MyParams,self).__init__()
        self.name = 'hello'
    def build(self,input_shape):
        self.dense0 = keras.layers.Dense(units = 25,
                                #kernel_initializer = self.create_initializer(),
                                name = "dense0")
    def call(self,inputs):
        results = self.dense0(inputs)
data = MyParams()
print(data.name)

此时会相应的报错

AttributeError: Can't set the attribute "name", likely because it conflicts with an existing read-only @property of the object. Please choose a different name.

也就是说,在keras之中的"self.name"为只读属性,不能够被定义,此时需要更换另外一个名字。

但是只有name这个属性能够对应到self.weights的名称之中,那么这里我们该如何定义呢

此时我发现,直接定义在__init__函数之前,可以对keras的名称完成相应的定义

import params as pp
import params_flow as pf
import tensorflow as tf
import tensorflow.keras as keras
class MyParams(tf.keras.layers.Layer):   
    name = 'hello'
    def __init__(self):
        super(MyParams,self).__init__()
        
    def build(self,input_shape):
        self.dense0 = keras.layers.Dense(units = 25,
                                #kernel_initializer = self.create_initializer(),
                                name = "dense0")
    def call(self,inputs):
        results = self.dense0(inputs)
data = MyParams()
print(data.name)

同时我们传入一个tensor的input_ids类型进行相应的输入,发现已经能够对weights的权重名称进行改变了

input_ids = keras.layers.Input(shape=(50,), dtype='int32', name="input_ids")
outputs = data(input_ids)
data.weights

对应的输出内容如下

[<tf.Variable 'hello/dense0/kernel:0' shape=(50, 25) dtype=float32, numpy=
 array([[-0.10505645,  0.09756875,  0.14427656, ..., -0.17254017,
         -0.18592533, -0.13920134],
        [-0.10033116, -0.17831415, -0.03435555, ..., -0.02460951,
          0.13194972,  0.21918347],
        [ 0.15699485, -0.24836   ,  0.01044622, ...,  0.04577217,
          0.23334488,  0.09155059],
        ...,
        [-0.22210473,  0.14221036,  0.07721925, ...,  0.03358698,
          0.08100349,  0.15415356],
        [-0.1433322 , -0.00878078, -0.0760702 , ..., -0.06091703,
          0.18796855, -0.19009456],
        [-0.0446853 ,  0.14639893,  0.1729418 , ..., -0.04699725,
          0.12940568, -0.24003454]], dtype=float32)>,
 <tf.Variable 'hello/dense0/bias:0' shape=(25,) dtype=float32, numpy=
 array([0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 0., 0.], dtype=float32)>]

可以发现这里的权重内容已经变成hello打头的内容了,然而此时又一个对应的问题出现了,这得益于__init__函数前面内容的特殊性:

如果我们将对应的内容改为如下

import params as pp
import params_flow as pf
import tensorflow as tf
import tensorflow.keras as keras
class MyParams(tf.keras.layers.Layer):   
    print('begining')
    name = 'hello'
    def __init__(self):
        super(MyParams,self).__init__()
        
    def build(self,input_shape):
        self.dense0 = keras.layers.Dense(units = 25,
                                #kernel_initializer = self.create_initializer(),
                                name = "dense0")
    def call(self,inputs):
        results = self.dense0(inputs)
data = MyParams()
print(data.name)

此时运行的时候会运行一次print(‘begining’),输出对应的begining的内容,

也就是说__init__函数之前的内容会在定义MyParams这个类的时候就调用,而MyParams这个类只会被定义一次,也就是说__init__函数之前的内容只会被调用一次。

这样就带来了一个问题,也就是name = 'hello’这里的name没有办法修改,也就是说我们需要想一种办法将__init__函数前面的name='hello’修改一次,这里究竟该如何修改呢?

此时我们只需要在定义之后每次使用的时候重新对name的值进行定义即可

具体的例子如下

import tensorflow as tf
import tensorflow.keras as keras
class MyParams(tf.keras.layers.Layer):   
    #print('begining')
    name = 'hello'
    def __init__(self):
        super(MyParams,self).__init__()
    def build(self,input_shape):
        self.dense0 = keras.layers.Dense(units = 25,
                                #kernel_initializer = self.create_initializer(),
                                name = "dense0")
    def call(self,inputs):
        results = self.dense0(inputs)
data = MyParams()
print(data.name)
data.name = 'hello10000'
print(data.name)

输出的内容为

输出的内容1

进一步查看一下对应的weight的属性

查看weights对应的属性名称

可以看出这里weights之中的属性名称已经成功地被我们定义了

总结

由于name的属性的特殊性,如果在__init__函数之中直接定义可读变量会造成报错,此时我们需要调整思路,通过__init__函数之前定义name变量实现对于name的修改

以上为个人经验,希望能给大家一个参考,也希望大家多多支持。

Copyright 2022 版权所有 软件发布 访问手机版

声明:所有软件和文章来自软件开发商或者作者 如有异议 请与本站联系 联系我们